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TTie invention relates to a device (10) for hiding information in a 
text. Said device comprises means (18) for linguistically analyzing the 
text to produce text components, means (20) for determining a plurality 
of formulation alternatives for the text by varying the order of the text 
components and optionally additionally by using synonyms for said text 
components. Every formulation alternative is grammatically correct for 
the text and has essentially the same meaning as the text. Certain partial 
information is allocated to every sequence and/or to every synonym or to 
every paraphrase. The device further comprises means (22) for selecting 
a formulation alternative from the plurality of formulation alternatives in 
such a manner that the partial information that is allocated to the selected 

formulation corresponds to the information to be hidden. The inventive device also encompasses means (24) for outputting the formulation 
alternative that forms a modified text, said modified text containing information to be hidden. A device for extracting breaks the modified 
text down into its text components and uses the partial information allocated to said text components to extract the hidden information. The 
inventive device and method provide a means for flexibly and inconspicuously introducing large amounts of informadon to be hidden into 
any text. 





(57) Zusammenfassung 

Eine Vorrichtung (10) zum Verbergen von Informationen in einem Text umfasst eine Einrichtung (12) zum Liefem des Textes. eine 
Einrichtung (18) zum sprachlichen Analysieren des Textes» urn Textbestandteile zu liefem, eine Einrichtung (20) zum Bestimmen einer 
Mehrzahl von Formulierungsaltemativen fur den Text durch Variieren der Reihenfolge der Textbestandteile und gegebenenfalls zusatzHch 
durch Verwenden von Synonymen fur die Textbestandteile, wobei jede Formulierungsaltemative fiir den Text grammatikalisch richtig 
ist und den im wesentlichen gleichen Sinn wie der Text hat, wobei jeder Reihenfolge und/oder jedem Synonym oder jeder Paraphrase * 
bestimmte Teilinformationen zugeordnet sind, eine Einrichtung (22) zum Auswahlen einer Formulierungsaltemative aus der Mehrzahl von 
Formulierungsaltemativen, derart, dass die Teilinformationen, die der ausgewahlten Formulierung zugeordnet sind, den zu verbergenden 
Informationen entsprechen, und eine Einrichtung (24) zum Ausgeben der Formulierungsaltemative. die einen modifizierten Text bildet, , 
wobei in dem modifizierten Text zu verbergende Informationen enthalten sind. Eine Vorrichtung zum Extrahieren zerlegt den modifizierten 
Text in seine Textbestandteile und venvendet dann die diesen Textbestandteilen zugeordneten Teilinformationen, um die verborgenen 
Informationen wieder zu extrahieren. Dam it konnen zu verbergende Informationen flexibel und unauffallig sowie in hoher Menge in einen 
beliebigen Text eingebracht werden. 
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Vorrichtung und Verfahren zum Verbergen von Inf ormationen 
und Vorrichtung und Verfahren zum Extrahieren von 

Inf ormationen 



Beschreibuna 

Die vorliegende Erfindung bezieht sich auf die Stegano- 
graphie und insbesondere auf ein steganographisches Konzept, 
das maximale Sicherheit liefert, derart, daJ3 kein Verdacht 
geschopft wird, daB ein Text verborgene Inf ormationen ent- 
halt. 

Grundsatzlich bezieht sich die Steganographie auf ein Gebiet 
der Technik;. in dem versucht wird, geheime Nachrichten in 
anderen Nachrichten zu verstecken, derart^ daB ein Nicht- 
Befugter uberhaupt keinen Verdacht schopft, dafi in der ihm 
vorliegenden Nachricht eine geheime Nachricht versteckt ist. 
Damit kann im Gegensatz zur Kryptographie , d. h. dem Ver- 
schllisseln von Nachrichten ein effektiver Schutz geheimer 
Nachrichten erreicht werden, da ein Nicht-Bef ugter uberhaupt 
keinen Verdacht schopft, daJ3 eine Nachricht eine geheime 
Nachricht enthalt, Dagegen kann man verschliisseiten Nach- 
richten ohne weiteres ansehen, daB sie verschlusselt sind. 
Es existieren viele Techniken, urn Verschlusselungen zu 
"knacken"* In der Technik besteht ein Konsens dariiber, daB 
auf beliebige Art und Weise verschliisselte Nachrichten mit 
einem beliebig hohen Auf wand entschllisselt werden konnen. 
Die Anstrengungen in der Kryptographie konzentrieren sich 
daher insbesondere darauf, den Auf wand fur einen unbefugten 
Entschlussler so groB als moglich zu machen, derart, daB er, 
abgeschreckt von dem hohen Auf wand, von einem unbefugten 
Entschlusseln der verschliisseiten Nachrichten absieht. Unter 
bestimmten Umstanden wird jedoch ein beliebig hoher Auf wand 
in Kauf genommen, um besonders wichtige Nachrichten ent- 
schliisseln zu konnen. Man nimmt an, daB es fur viele der 
bekannten Verschliisselungsverf ahren intelligentere aber 
dafiir weniger aufwendige Verfahren zum "Knacken" gibt. Fiir 
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keines der bisher bekannten Verfahren kann man ein solches 
effizientes "Knacken" ausschlieBen * Hier ist die Stegano- 
graphie eine Erganzung. Die Steganographie - Steganographie 
bedeutet urspriinglich verdecktes Schreiben - versucht, eine 
geheime Information so in einer Nachricht zu verstecken, dai3 
niemand iiberhaupt Verdacht schopft, daJ3 hier bereits eine 
geheime Nachricht versteckt ist. In diesem Fall wird auch 
der allerhochste Aufwand nichts nlitzen, da ein Unbefugter 
gar nicht weiJ3, welche Nachricht eine geheime Nachricht 
enthalt, insbesondere wenn er eine groBe Menge von Nach- 
richten uberwachen soil* 

In jiingster Zeit besteht ein groBer Bedarf nach stegano- 
graphischen Techniken, da sich die "email" immer weiter 
ausgebreitet hat, wobei die Anwendungen nicht mehr nur im 
militarischen Bereich sind, insbesondere besteht bei Firmen 
der Bedarf, geheimzuhaltende Geschaf tszahlen elektronisch zu 
iibermitteln. Es versteht sich von selbst, daB kein Unbefug- 
ter durch Anzapfen einer Datenleitung , die beispielsweise 
ein Teil des -Internets sein kann, Zugang zu solchen geheimen 
Geschaf tsdaten haben soil. So existieren eine Vielzahl von 
Mail-Programmen, die einen Text vor dem Verschicken ver- 
schllisseln, Wie es jedoch bereits ausgeflihrt worden ist, 
existiert keine sichere Verschliisselung . 

Daher haben sich in jiingster Zeit moderne Steganographie- 
konzepte herausgebildet . Eines dieser Steganographiekonzepte 
besteht darin, in Bilddateien das letzte Bit oder Least 
Significant Bit von Bildpixeln fiir die Speicherung der zu 
verbergenden Inf ormationen zu benutzen. Solche Verfahren 
werden ausfiihrlich von Joshua R. Smith u. a., "Modulation 
and Information Hiding in Images", First International 
Workshop, Cambridge, UK, 30. Mai bis 1. Juni 1996, Seiten 
207-225 ausfiihrlich beschrieben. Obgleich in Bildern sehr 
viele geheimen Inf ormationen versteckt werden konnen, ist an 
diesen Verfahren nachteilig, daB Bilddateien im allgemeinen 
sehr groBe Dateien sind, weshalb eine Ubertragung mittels 
elektronischer Post relativ lange dauert. AuBerdem ist ein 
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haufiges Versenden von sehr groBen Dateien zwischen einem 
liblichen Sender und einem liblichen Empfanger relativ auf- 
fallig, was dem steganographischen Gedanken an sich zuwider 
lauf t . 

Bekannte Verfahren zum Verbergen von Inf ormationen in Texten 
bestehen darin, daB bestimmte einfach vordef inierte Satz- 
strukturen erzeugt werden konnen, wobei die grammatikalische 
Zusammenstellung eines bestimmten Satzes eine iiblicherweise 
binare zu verbergende Information wiederspiegelt . Diese Ver- 
fahren sind ausflihrlich in Peter Wayner, "Disappearing 
Cryptography", Acadamic Press Inc., 1996, S. 91 - 121, 
beschrieben. Solche vordef inierten Grammatiken haben den 
Nachteil, daB sich ein Sender und ein Empfanger, wenn sie 
haufig geheime Inf ormationen kommunizieren wollen, dauernd 
Texte mit im wesentlichen gleichem Inhalt oder mit nur ge- 
ring abgewandeltem Bedeutungsinhalt schicken, woraus der 
Verdacht geschopft werden kann, daB hier geheime Inf orma- 
tionen versteckt sind* 

Bekannte Verfahren zum Verbergen von Inf ormationen in Texten. 
verwenden daher entweder vordef inierte Grammatiken, die. 
entweder nur einfache vordef inierte Satzstrukturen erzeugen 
konnen oder aber allein auf der Veranderung der Steuerzei- 
chen, Leerzeichen und Tabulatoren beruhen, Beide Verfahren 
sind relativ auffallig, nur sehr begrenzt einsetzbar, lie- 
fern nur eine geringe Bandbreite, d. h. die Menge der zu 
verbergenden Inf ormationen in einem bestimmten Text ist 
relativ klein, und dieselben sind nicht robust gegeniiber 
einfachen Veranderungen , wie z. B, durch Umf ormatieren des 
Textes Oder durch leichtes Umf ormulieren. Solche Verfahren 
sind daher ebenfalls fiir handschrif tliche Notizen oder Pas- 
sagen in Printmedien relativ ungeeignet, 

Insbesondere besteht ein Bedarf, iiber einen Zeitungsartikel 
geheime Inf ormationen an einen oder mehrere Empfanger zu 
verteilen. So ware es besonders auffallig, wenn an einer 
Stelle in der Zeitung auf einmal eine vordef inierte Gram- 
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matik sein wiirde, die allein aufgrund ihres Inhalts auf- 
fallt, es sei denn, daB die Grammatik zufallig an das ak- 
tuelle Tagesgeschehen aktualisiert worden ist. 

In der Fachverof f entlichung "Techniques for data hiding", W. 
Bender u. a., IBM Systems Journal, Bd. 35, Nr. 3 und 4, 
1996, Seite 313-336 sind verschiedene Steganographie-Konzep- 
te beschrieben, Unter anderem werden Moglichkeiten zum Ver- 
bergen von Daten in einem Text dargestellt, die ein Verfah- 
ren zum Verbergen von Inf ormationen iiber die Manipulation 
von unbenutztem Raum auf der bedruckten Seite, ein syntak- 
tisches Verfahren, bei dem z* B. die Satzzeichen zum Verber- 
gen von Inf ormationen verwendet werden, und ein semantisches 
Verfahren umfassen, bei dem zum Verbergen von Inf ormationen 
eine Manipulation der Worter selbst verwendet wird. Beim 
semantischen Verfahren wird zwei Synonymen ein Primar- bzw. 
ein Sekundar-Wert zugeordnet. Im Falle vieler Synonyme kann 
mehr als ein Bit pro Synonym codiert werden. Als problema- 
tisch wird angesehen, dafl der Wunsch nach dem Verbergen von 
moglichst vielen Inf ormationen mit den doch vorhandenen Be- 
deutungsunterschieden zwischen den Synonymen kollidieren 
kann. Beim syntaktischen Verfahren wird die Diktion und die 
Struktur von Texten verandert, ohne da/3 die Bedeutung bzw. 
der Ton wesentlich verandert wird. Dies wird dadurch er- 
reicht, daJ3 im Falle des Vorliegens einer grammatikalischen 
Struktur, die einen Hauptsatz und einen Nebensatz aufweist, 
ein Inf ormationsbit dadurch in dem Text verborgen wird, daB 
der Nebensatz vor dem Hauptsatz angeordnet ist, oder daJ3 der 
Nebensatz nach dem Hauptsatz angeordnet ist. Bei diesem Ver- 
fahren wird als problematisch angesehen, daB die Moglichkei- 
ten zum Verbergen von Inf ormationen begrenzt sind. 

Die EP 0 268 367 bezieht sich auf eine Schnittstelle fur na- 
turliche Sprache, welche dazu verwendet wird, die semanti- 
sche Korrektheit einer Abfrage sicherzustellen . Hierzu wird 
ein zu analysierender Text in einen Lexikon-Analysator ein- 
gegeben, welcher mit einem Synonym-Lexikon verbunden ist, um 
eine Synonym-Substitution durchzuf lihren, um einem dem Lexi- 
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kon-Analysator nachgeschalteten Parser ein moglichst kleines 
Standardvokabular ubermitteln zu konnen. Der Parser ist zu- 
satzlich mit einem Hauptlexikon und einer Grammatikstuf e 
verbunden, um eine syntaktische Analyse der Texteingabe, 
welche gegebenenf alls Synonyme aufweist, durchzuf uhren. Die 
Aufgabe des Parsers wird in eine Vereinf achungsstuf e einge- 
speist, die dazu fiihrt, einen Recall oder eine Anzahl von 
Treffern oder eine Anzahl der zuriickgelief erten Dokumente 
einer Abfrage zu erhohen* Die vereinf achte Abfrage wird wie- 
derum einer Ubersetzungsstuf e zugefuhrt, welche mit einem 
Datenbankverwaltungssystem gekoppelt ist, das eine Ausgabe 
erzeugen kann, die als Schnittstelle fur einen Benutzer fun- 
gieren kann. 



Das US-Patent Nr. 5,424,94 7 bezieht sich auf eine Vorrich- 
tung und ein Verfahren zum Analysieren von nattirlicher Spra- 
Che und auf den Aufbau einer Wissensdatenbank fur die Analy- 
se von naturlicher Sprache. Ein Satz wird durch einen Parser 
syntaktisch analysiert, um die Phrasenstruktur desselben 
einschlieBlich einer vorhandenen Mehrdeutigkeit zu liefern. 
Die Phrasenstruktur wird einem Abhangigkeitsanalysator zuge- 
fuhrt, der ausgangsseitig eine Abhangigkeitsstruktur ohne 
Mehrdeutigkeit erzeugt. Hierzu wird auf eine Wissensdaten- 
bank zugegrif fen, welche Abhangigkeits-/Taxonym-/Synonym- 
Daten und Kontextabhangigkeitsdaten umfaBt. Die Abhangig- 
keitsstruktur ohne Mehrdeutigkeit wird einem System zur 
automatischen Verarbeitung von naturlichsprachigen Texten, 
wie z. B. einem maschinellen Ubersetzungssystem, zugefuhrt. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
verbessertes steganographisches Konzept zu schaffen, das 
flexibel einsetzbar ist und gleichzeitig ein hohes Ma/3 an 
Unauf f alligkeit liefert. 

Diese Aufgabe wird durch eine Vorrichtung zum Verbergen von 
Informationen nach Patentanspruch 1, durch eine Vorrichtung 
zum Extrahieren von Informationen nach Patentanspruch 20, 
durch ein Verfahren zum Verbergen von Informationen nach 
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Patentanspruch 25 und durch ein Verfahren zum Extrahieren 
von Inf ormationen nach Patentanspruch 2 6 gelost. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
dai3 die natiirlichste Nachrichtenart zum Verbergen von in- 
f ormationen Text ist. Das ubliche Koimnunikationsmedium be- 
steht nicht im Versenden von Bildern sondern im Versenden 
von textuellen Nachrichten, Allein aus diesem Grund eignet 
sich normaler Text am besten zum Verbergen von Informatio- 
nen, GemaB der vorliegenden Erfindung wird zum Verbergen von 
Inf ormationen in einem Text die Sprache an sich verwendet. 
Jede Sprache enthalt eine auiierordentlich groJie Redundanz, 
Daher konnen viele verschiedenen Dinge auf eine sehr groi3e 
Anzahl von Arten und Weisen ausgedriickt werden, Formulie- 
rungsalternativen bestehen in verschiedenen Satzstellungen, 
verschiedenen Synonymen und verschiedenen Prapositionen etc . 
Bestimmte Satzstellungen sind aufgrund der grammatikalischen 
Regeln verboten und wurden daher sofort auf fallen. Daher 
werden zum Verbergen von Inf ormationen nur die Formulie- 
rungsalternativen verwendet, die ( grammatikalisch und 
lexikalisch) zulassig sind. Allgemein gesagt wird ein Text 
abhangig von den zu verbergenden Inf ormationen umf ormuliert 
wobei die Inf ormationen in dem umf ormulierten Text verborgen 
sind. Solche umf ormulierten Texte werden nicht auf fallen, da 
sie keine kiinstlichen Elemente umfassen sondern lediglich 
eine andere Art und Weise des Ausdriickens eines bestimmten 
Sachverhalts sind. Personen oder Programme, die eine Viel- 
zahl von Nachrichten daraufhin untersuchen, ob hier geheime 
Inf ormationen verborgen sind, flihren nicht immer Statistiken 
liber die ublichen Ausdrucksweisen des Verfassers. In diesem 
Fall kann man groBere Umf ormulierungsf reiheiten gestatten. 
Vermutet man, daJ3 solche Statistiken gefiihrt werden, konnen 
noch immer automatische Umf ormulierungen unter Einhaltung 
dieser typischen Charakteristik durchgefiihrt werden. Uber- 
wacher haben daher keine Moglichkeit, f estzustellen, ob ein 
Text bearbeitet worden ist oder nicht. Damit wird dem Kern- 
gedanken der Steganographie Geniige geleistet, der darin be- 
steht, Inf ormationen so zu verbergen, dai3 ein Unbefugter gar 



wo 00/54452 




PCT/EPOO/02144 



nicht erkennt.^ daB iiberhaupt Nachrichten verborgen sind. 

GemaB einem ersten Aspekt betrifft die vorliegende Erfindung 
eine Vorrichtung zum Verbergen von Inf ormationen in einem 
Text, der zumindest einen Sat 2 aufweist, mit folgenden Merk- 
malen : 

einer Einrichtung zum Liefern des Textes; 

einer Einrichtung zum sprachlichen Analysieren des Textes, 
um Textbestandteile zu liefern, wobei die Textbestandteile 
Bestandteile des Satzes sind, und wobei der Satz neben zu- 
mindest einem weiteren Bestandteil als Bestandteil genau ein 
Pradikat auf weist ; 

einer Einrichtung zum Bestimmen einer Mehrzahl von Formulie- 
rungsalternativen fur den Text 

- durch Variieren der Reihenfolge der Textbestandteile 
selbst , 

- durch Ermitteln von Synonymen fiir die Textbestandtei- 
le und Variieren der Reihenfolge der Synonyme fiir die 
Textbestandteile , oder 

- durch Ermitteln von Synonymen fiir zumindest einen 
Textbestandteil und Variieren der Reihenfolge eines 
Synonyms fiir den zumindest einen Textbestandteil und 
eines anderen Textbestandteils des Satzes, 

wobei jede Formulierungsalternative fiir den Text gram- 
matikalisch richtig ist und den im wesentlichen glei- 
chen Sinn wie der Text hat, wobei jeder Reihenfolge und 
jedem ermittelten Synonym bestimmte Teilinf ormationen 
zugeordnet sind; 

einer Einrichtung zum Auswahlen einer Formulierungsalterna- 
tive aus der Mehrzahl von Formulierungsalternativen, derart. 
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daJ3 die Teilinf ormationen , die der ausgewahlten Formulie- 
rungsalternative zugeordnet sind, zumindest einem Teil der 
zu verbergenden Inf ormationen entsprechen; und 

einer Einrichtung zum Ausgeben der Formulierungsalternative , 
die einen itiodif izierten Text bildet, wobei in dem modifi- 
zierten Text die zu verbergenden Inf ormationen verborgen 
sind . 

Die "Teilinf ormationen" sind in einem bevorzugten Ausflih- 
rungsbeispiel Kompressions-Symbole , denen direkt binare 
Codes zugeordnet sein konnen. Der modifizierte Text hat so- 
mit den im wesentlichen gleichen Sinn wie der urspriingliche 
Text, Dieser Sinn ist jedoch im modif izierten Text anders 
formuliert, wobei die geheimen Inf ormationen in der - gram- 
matikalisch richtigen - Formulierung stecken . 

GemaB einem zweiten Aspekt betrifft die vorliegende 
Erfindung eine Vorrichtung zum Extrahieren von in einem 
modif izierten Text verborgenen Inf ormationen, wobei der 
modifizierte Text zumindest einen Satz aufweist, mit folgen- 
den Merkmalen: 

einer Einrichtung zum Liefern des modif izierten Textes; 

einer Einrichtung zum sprachlichen Analysieren des modifi- 
zierten Textes, um Textbestandteile des modif izierten Textes 
zu liefern, wobei die Textbestandteile Bestandteile des 
Satzes sind, und wobei der Satz neben zumindest einem wei- 
teren Bestandteil als Bestandteil genau ein Pradikat auf- 
weist ; 

einer Einrichtung zum Liefern von Teilinf ormationen, die der 
Reihenfolge der Textbestandteile und, falls der modifizierte 
Text in sprachlichen Bedeutungen der Textbestandteile ver- 
borgene Inf ormationen hat, den sprachlichen Bedeutungen der 
Textbestandteile zugeordnet sind, wobei die Einrichtung zum 
Liefern von Teilinf ormationen die gleichen Teilinf ormationen 
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liefert, die bei dem Verbergen der Inf ormationen , urn den 
modif izierten Text zu erzeugen, der Reihenfolge der Textbe- 
standteile und gegebenenf alls den sprachlichen Bedeutungen 
der Textbestandteile zugeordnet waren; 

einer Einrichtung zum Kombinieren der Teilinf ormationen, die 
fur den modif izierten Text durch die Einrichtung zum Liefern 
von Teilinf ormationen geliefert wurden, um die in dem mo- 
dif izierten Text verborgenen Inf ormationen zu erhalten; und 

einer Einrichtung zum Ausgeben der verborgenen Informatio- 
nen. 

Anders ausgedrlickt analysiert die Vorrichtung zum Extrahie- 
ren der geheimen Inf ormationen den modif izierten Text und 
extrahiert die geheimen Inf ormationen durch Ermitteln der 
Teilinf ormationen, die den einzelnen Formulierungsalterna- 
tiven zugeordnet sind. Um eine sinnvolle Extraktion zu er- 
reichen, ist es selbstverstandlich erf orderlich, dai3 die 
Vorrichtung zum Extrahieren die Zuordnung von Teilinforma- 
tionen zu Wortstellungsalternativen, Synonymen oder Para- 
phrasen kennt, die in der Vorrichtung zum Verbergen verwen- 
det wurden. Allerdings ist es nicht erf orderlich , daB die 
Vorrichtung zum Extrahieren den urspriinglichen Text, der 
modif iziert worden ist, kennt, da die Teilinf ormationen 
unabhangig von einem Text den Textbestandteilen bzw. der 
Reihenfolge derselben entsprechen und nicht auf einen spezi- 
fischen Text bezogen sind, der immer aus einer Kombination 
bestimmter Textbestandteile besteht . 



Ein wesentlicher Vorteil der vorliegenden Erfindung besteht 
darin, daB jeder beliebige natlirlich-sprachliche Text ver- 
wendet werden kann. Das erf indungsgemaiie Konzept ist daher 
nicht auf vordef inierte Grammatiken und ahnliches begrenzt. 
Damit entfallt das Verdacht-erzeugende Kommunizieren mittels 
im wesentlichen ahnlicher Texte. 



Ein weiterer Vorteil der vorliegenden Erfindung besteht da- 
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rin, daB das erf indungsgemaBe Konzept gegeniiber Textforma- 
tierungen vollig unempf indlich ist. So konnte beispielsweise 
ein modif izierter Text ausgedruckt werden oder sogar per 
Hand abgeschrieben werden und auf irgendeine Art und Weise 
zu einem Empf anger iibertragen werden, der die grammatika- 
lischen und lexikalischen Inf ormationen des Senders kennt, 
der die unter Umstanden sogar handgeschriebenen Notizen 
einfach einscannt, um so den modif izierten Text in seine 
Vorrichtung zum Extrahieren einzuspeisen • 

Die erf indungsgemaBe Vorrichtung ist ferner gegeniiber 
leichten Modif ikationen des Text an sich, beispielsweise 
wenn Tippfehler korrigiert werden, einfache Artikelf ehler 
korrigiert werden. Singular /Plural-Endungen modif iziert 
werden, usw* robust* 

Je nach Ausf iihrungsf orm der erf indungsgemafien Vorrichtung 
und des erf indungsgemaBen Verfahrens wird lediglich die Rei- 
henfolge der Textbestandteile selbst variiert, und es werden 
keine Synonyme ermittelt, um noch mehr Inf ormationen in dem 
Text zu verbergen. Alternativ konnen flir alle Textbestand- 
teile Synonyme ermittelt werden, wobei dann statt der Rei- 
henfolge der Textbestandteile die Reihenfolge der Synonyme 
fiir die Textbestandteile variiert wird. SchlieBlich ist es 
auch moglich, nur fiir einen Teil der Textbestandteile des 
Satzes Synonyme zu ermitteln, um dann die Reihenfolge der 
Textbestandteile bzw. der fiir bestimmte Textbestandteile er- 
mittelten Synonyme zu variieren • 

Wie spater ausgefiihrt, konnen sogar beim Komprimieren der 
geheimen Daten steganographische Verfahren anwendet werden, 
die mit den Verfahren der textuellen Steganographie kombi- 
niert werden konnen: Entweder um bei Anderungen eine groBere 
Robustheit oder eine leichte Erkennbarkeit dieser Anderungen 
zu erreichen oder um die Menge der verbergbaren Daten zu er- 
hohen. Wird jedoch lediglich die Reihenfolge der Textbe- 
standteile zum Verbergen von Inf ormationen verwendet, so ist 
selbstverstandlich eine Umf ormulierung im Sinne anderer Sy- 
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nonyme ohne Einflu/i auf den Erfolg der Vorrichtung zum Ex- 
trahieren. Allerdings sinkt hier die Bandbreite, d, h. die 
Menge der Inf ormationen ^ die in dem Text verborgen werden 
konnen, erheblich. Somit existiert ein KompromiB zwischen 
einerseits Robustheit des modif izierten Textes gegenliber An- 
derungen und andererseits moglicher Bandbreite, wobei dieser 
Kompromifi je nach Benutzeranf orderung gefunden werden kann, 

Bevorzugterweise sind die zu verbergenden Inf ormationen in 
Form einer Binarsequenz gegeben. Urn diese Binarsequenz in 
dem Text verbergen zu konnen, sind die Teilinf ormationen , 
die den einzelnen Aiternativen zugeordnet sind, vorzugsweise 
ebenfalls Binardaten, die als Codeworter bezeichnet werden 
konnen. Daher ist zu sehen, daJ3 generell gesagt die Vorrich- 
tung zum Verbergen von Inf ormationen prinzipiell eine Deco- 
dierung verkorpert, wobei die geheimen Inf ormationen in 
einen modif izierten Text decodiert werden, wobei der ur- 
spriingliche Text die Codierumstande bzw. den Codierwort- 
schatz festlegt. Analog dazu fuhrt die Vorrichtung zum 
Extrahieren der Inf ormationen einen Codierschritt aus, wobei 
der modif izierte Text gemaB den Teilinf ormationen als "Co- 
dierwortschatz" in eine binare Sequenz codiert wird, die die 
extrahierten geheimen Inf ormationen umfaBt. 

Hierfiir konnen beliebige Codiertechniken verwendet werden, 
von denen hier lediglich beispielshaf t die Technik der 
arithmetischen Codierung und die Technik der Huffman-Co- 
dierung genannt seien. 

Ein weiterer Vorteil des erf indungsgemaBen Konzepts besteht 
darin, daB seine Anwendung sehr flexibel ist. Sollen bei- 
spielsweise Inf ormationen in einem Text verborgen werden, um 
den Text mit einem Wasserzeichen zu versehen, so dlirfte das 
Ermitteln von Synonymen generell ausscheiden, da die Textbe- 
standteile selbst zum Wasserzeichen beitragen und eine Er- 
setzung eines Textbestandteils durch ein Synonym u. U. das 
Wasserzeichen zerstoren kdnnte. Wenn das Wasserzeichen dage- 
gen lediglich iiber die Variation der Reihenfolge der Textbe- 
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standteile selbst, welche unverandert sind, in den Text ein- 
gebracht wird, so ist die Wahrscheinlichkeit zumindest 
grower, daB das Wasserzeichen durch solche Modif ikationen 
des Textes nicht beeintrachtigt wird. 

Fur Wasserzeichen-Anwendungen als Spezialfall der Stegano- 
graphie wird es nicht so sehr auf die Menge der zu verber- 
genden Inf ormationen ankommen, sondern eher darauf, daB ein 
Wasserzeichen iiberhaupt nicht von auBen vermutet wird. Wenn 
es dagegen mehr auf die Menge an Inf ormationen ankommt, die 
in dem Text zu verbergen sind, so kann das erf indungsgemaBe 
Konzept urn die Synonymermittlung erganzt werden, derart, daB 
im Gegensatz zur bekannten Synonymersetzung alleine auch die 
Reihenfolge der Synonyme aller Textbestandteile oder nur ei- 
nes bestimmten Anteils der Textbestandteile variiert wird* 
Wenn eine bestiininte Anzahl von Synonymen vorhanden ist, so 
wird die Variation der Reihenfolge der Synonyme im Vergleich 
zur alleinigen Synonymbildung die Menge an Inf ormationen, 
die in dem Text verborgen werden konnen, betrachtlich erho- 
hen. 

Ein weiterer Vorteil der vorliegenden Erfindung besteht da- 
rin, daB sie auch dort anwendbar ist, wo eine Synonymer- 
setzung per se ausgeschlossen ist. Urn dennoch Inf ormationen 
z. B, in Form eines Wasserzeichens in einem Text zu verber- 
gen, wird erf indungsgemaB nur die Reihenfolge der Bestand- 
teile von Satzen variiert. Fiir die meisten Autoren und Ver- 
lage gerade im Bereich der Fachliteratur ist eine Synonymer- 
setzung inakzeptabel, denn dann konnten Fachworter eines 
Spezialgebiets durch vermeintliche Synonyme ersetzt werden. 

Auch die anderen Techniken der Steganographie kommen meist 
nicht in Frage, da sie zu leicht entfernt werden konnen oder 
zu leicht bemerkt werden. Dies trifft gerade fur Texte im 
sog. "Open-eBook" -Format zu. Hier sind leichte Variationen 
in den Buchstabenpositionen , wie es etwa fur PDF-Dokumente 
bekannt ist, nicht moglich, da es sich um einfache Texte 
handelt, die kein Microspacing haben. Somit erlaubt die er- 
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f indungsgemaBe Variation der Satzbestandteilreihenf olge auch 
in diesen bisher von der Steganographie ausgeschlossenen Be- 
reichen die Redundanz eines Textes fur ein digitales Wasser- 
zeichen z. B. zu Urheberrechtsschutzwecken gegen Piraterie- 
angriffe zu verwenden. Mit Hilfe der vorliegenden Erfindung 
laBt sich die Anzahl der in einem Textabschnitt verbergbaren 
Inf ormationen erst so weit erhohen, daiJ ein Wasserzeichen 
sinnvoll wird. Es wird namlich bevorzugt, in jedem langeren 
Absatz z. B. die komplette Autoren-ID zu speichern, was nor- 
malerweise eine Bandbreite von mindestens 2 Bytes erfordert. 

Bevorzugte Ausf iihrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend bezugnehmend auf die beigefugten Zeich- 
nungen detailliert beschrieberi. Es zeigen: 



Fig. 1 ein schematisches Blockdiagramm einer erfindungs- 
gemaBen Vorrichtung zum Verbergen; 

Fig. 2 ein schematisches Blockdiagramm einer erfindungs- 
gemaBen Vorrichtung zum Extrahieren; 

Fig. 3 ein Ablauf diagramm zur Alternativengenerierung fiar 
eine Phrase gemaB einem bevorzugten Ausf lihrungsbei- 
spiel der vorliegenden Erfindung; und 

Fig. 4 ein Ablauf diagramm zur Veranschaulichung der Be- 
handlung einzelner Alternativen gemaB der vorlie- 
genden Erfindung. 



Fig. 1 zeigt ein Blockdiagramm einer erf indungsgemaBen Vor- 
richtung 10 zum Verbergen von Inf ormationen in einem Text, 
der uber einen Texteingang 12, d. h. eine Einrichtung zum 
Liefern des Textes, zugefuhrt wird. Die Vorrichtung 10 zum 
Verbergen von Informationen umfaBt ferner einen weiteren 
Eingang 14 fiir die zu verbergenden Informationen sowie einen 
Ausgang 16 flir einen modif izierten Text, der sinngemaB dem 
urspriinglichen Text entspricht, in dem jedoch die zu verber- 
genden Informationen enthalten sind. 
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Die Vorrichtung 10 zum Verbergen von Inf ormationen umfaiJt 
ferner eine Einrichtung 18 zum sprachlichen Analysieren des 
Textes, urn Textbestandteile zu liefern. Diese Textbestand- 
teile konnen einer Einrichtung 2 0 zum Bestimmen einer Mehr- 
zahl von Foritiulierungsalternativen fiir den Text zugefiihrt 
werden. Eine Einrichtung 22 zum Auswahlen einer Formulie- 
rungsalternative aus der Mehrzahl von Formulierungsalterna- 
tiven ist angeordnet, um die Formulierungsalternative aus- 
zuwahlen, deren Teilinf ormationen den zu verbergenden 
Informationen entspricht. Der Einrichtung 22 zum Auswahlen 
einer Formulierungsalternative ist eine Einrichtung 2 4 zum 
Ausgeben der Formulierungsalternative, die den modif izierten 
Text bildet, nachgeschaltet , um den modif izierten Text an 
dem Ausgang 16 auszugeben. 



Im nachf olgenden wird auf die einzelnen Elemente der Vor- 
richtung 10 zum Verbergen von Informationen in einem Text 
eingegangen. 

Die Einrichtung 18 zum Analysieren des Textes, um Textbe- 
standteile zu liefern, ist angeordnet, um ein sogenanntes 
"Parsing"-Verf ahren durchzuf iihren, Vorzugsweise ist die 
Einrichtung 18 zum sprachlichen Analysieren des Textes ein 
sogenannter HPSG-Parser (HPSG = Head-driven Phrase Structure 
Grammar). Das Standardwerk zu dessen Realisierung ist 
Pollard and Sag: "Head driven Phrase Structure Grammar", 
University of Chicago Press, 1994. Neben dem HPSG-Parser 
sind in der Technik viele andere Parser bekannt, die eben- 
falls bei der vorliegenden Erfindung zum Einsatz kommen 
konnen. Insbesondere HPSG-Parser sind moderne hochlexikali- 
sierte unif ikationsbasierte Parser. Vorzugsweise arbeiten 
solche Einrichtungen satzweise. Allgemein gesagt wird, wie 
es spater erlautert wird, der Text in seine linguistischen 
Textbestandteile zerlegt, wobei zunachst der Kopf des Sat- 
zes, der iiblicherweise das Verb ist, ermittelt wird, um 
anschlieJ3end andere Konstituenten des Satzes, etwa ein Sub- 
jekt, Komplemente und Adjunkte, zu bestimmen. Die groBten 
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Vorteile eines unif ikationsbasierten Parsers fiir HPSG ge- 
geniiber anderen Parsern sind, daB (a) die gleichen Spezi- 
fikationen fiir Analyse (eines Ausgangssatzes ) und Generation 
(der umf ormulierten Satze) verwendet werden (b) es nur etwa 
ein Dutzend Parseregeln pro Sprache gibt - alles andere ist 
deklarativ spezifiziert im Lexikon, erfordert wenig Program- 
mieraufwand und laflt sich leicht auf andere Sprachen iiber- 
tragen (c) Inf ormationen von verschiedenen linguistischen 
Ebenen / Bereichen (Syntax, Semantik, Pragmatik) leicht 
kombiniert werden konnen. Hieraus ergibt sich die sehr enge 
Kopplung zwischen Parser und einem inhaltlich reichhaltigen 
Lexikon, vorzugsweise basierend auf dem Formalismus der ge- 
typten Merkmalstrukturen . Ein solcher Parser liefert die 
syntaktische oder sogar die semantische Struktur eines 
Satzes als Baum oder Graphstruktur . Bzgl. der Satzstellung 
werden zusammengehorige Worter als solche identif iziert . 
Inf ormationen zur Konstituenten-Reihenf olge (also der Satz- 
stellung) konnen direkt fiir Kopfeintrage zusammen mit se- 
mantischen Inf ormationen lexikalisch spezifiziert sein, 
insbesondere bei Verben, Dies dient dazu, sehr friihzeitig 
viele Parsingalternativen auszuschlieBen . Parsingalterna- 
tiven miissen ausgeschlossen werden, die Formulierungsalter- 
nativen ergeben, die grammatikalisch falsch sind- Ferner ist 
es fiir das steganographische Konzept der vorliegenden Erfin- 
dung entscheidend, daB der modifizierte Text den im wesent- 
lichen gleichen Sinn wie der ursprlingliche Text hat, 

Stefan Muller: "Scrambling in German - Extraction into the 
mittelfeld". Proceedings of the tenth Pacific Asia Con- 
ference on Language, Information and Computation, City 
University of Hong Kong, 1995 beschreibt, wie man flirs 
Deutsche Regeln bzw. Constraints zur Wortstellung in 
HPSG-Systemen ableitet. Gregor Erbach: "Ambiguity and 
linguistic preferences" in "H. Trost (ed. ) : Feature 
Formalisms and Linguistic Ambiguity", Ellis-Horwood, 1993 
beschreibt, wie man solchen Wortstellungsalternativen so 
Wahrscheinlichkeiten zuordnen kann, daB sie dem realen 
Sprachgebrauch sehr nahe kommen. 
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Ein HPSG-Parser ist ein Spezialfall eines unif ikations- 
basierten Parsers, der mit getypten MerJonalstrukturen 
arbeitet. Ein HPSG-Parser benotigt zwingend Lexikon- und 
Grammatik-Komponenten zum Arbeiten, Lexika und Grammatik 
bilden eine Einheit, auiierdem gibt es einige wenige Regeln, 
in HPSG "Schemata", "Prinzipien" , "lexikalische Regeln" 
genannt. Auch andere Parser, die nur Regeln benotigen, oder 
die nicht mit getypten Merkmalstrukturen , sondern mit fast 
beliebigen anderen Datenstrukturen arbeiten, und/oder die 
Statistiken beriicksichtigen konnen oder nicht, konnen fiir 
die vorliegende Erfindung eingesetzt werden. 

Die Einrichtung 20 zum Bestimmen einer Mehrzahl von For- 
mulierungsalternativen fiir den Text kann eng mit dem HPSG- 
Parser gekoppelt sein, Vorzugsweise besteht die Einrichtung 
20 aus zwei Teilkomponenten : Erstens einer Lexikon/Gram- 
matik-Stufe und zweitens einer Komponente zur Generierung 
der moglichen Satzstellungs- und Formulierungsalternativen 
aus einer Menge von Regeln oder Constraints, die zuvor durch 
Lexikonzugrif f und/oder Parsing ermittelt wurden. Ersetzun- 
gen durch aquivalente Phrasen konnen relativ einfach durch 
Zugriff auf ein Synonymlexikon vorgenommen werden, und Texte 
konnen aufgrund der kopf gesteuerten Vorgehensweise sehr 
effizient komprimiert werden: Die Vorhersagbarkeit fiir die 
nachsten zu komprimierenden Daten ist so sehr hoch. Beim 
Ersetzen der Synonyme gibt es zwei gangige Alternativen: 
Entweder man benutzt ein Vollformenlexikon, das alle 
gangigen flektierten Formen enthalt. Beispiel: "lauft" ist 
synonym zu "geht". In einer anderen Variante sind nur 
Grundformen gleichgesetzt . Beispiel: "laufen" ist synonym zu 
"gehen". Hier wird zusatzlich eine morphologische Komponente 
benotigt, die im Beispiel "lauft" analysiert als "3. Person 
Singular von laufen", und aus "3. Person Singular von gehen" 
"geht" generiert. Losungen hierzu sind in der Technik 
wohlbekannt als regelbasierte Morphologie, Zwei-Ebenen- 
Morphologie oder Morphologie mit endlichen Zustandsmengen • 
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GemaB der vorliegenden Erfindung dient die Einrichtung 20 
zum Bestimmen einer Hehrzahl von Formulierungsalternativen 
dazu, Moglichkeiten fiir den modif izierten Text zu schaffen. 
Dies kann insbesondere durch Variieren der Reihenfolge der 
Textbestandteile und/oder durch Verwenden von Synonymen fiir 
die Textbestandteile erreicht werden* Im Sinne dieser Erfin- 
dung ist ein Synonym nicht nur als Synonym fur ein einzelnes 
Wort sondern auch als Paraphrase, also Synonym fiir einen 
Textbestandteil , d. h. eine Gruppe mit mindestens einem 
Wort, aufzufassen. Hat ein Textbestandteil mehrere Worte, so 
kann eine Paraphrase fiir diesen Textbestandteil weniger oder 
mehr Worte aufweisen, jedoch unter der Einschrankung, daB 
der Sinn des Textbestandteils nicht wesentlich verandert 
wird. Das MaJ3 der Ahnlichkeit bzw. der Abweichung laJit sich 
leicht beurteilen, wenn Worter semantischen Konzepten in 
einer semantischen Hierarchie (also einer Ontologie) zuge- 
ordnet sind und Knoten mit Gewichten und Kanten mit dem Grad 
der Ahnlichkeit der verbundenen Knoten gekennzeichnet sind. 

Eine einfache Formulierungsalternative eines Satzes besteht 
darin, dafi lediglich die Reihenfolge der Textbestandteile 
geandert wird. Bei den meisten Satzen erlaubt die Grammatik 
mehrere verschiedene Satzstellungen . Jeder Satzstellung wird 
eine eindeutige Teilinf ormation zugeordnet: In bevorzugten 
Ausfiihrung handelt es sich hierbei um Symbolcodes - wie 
schon im Abschnitt der Synonyme ausgefiihrt* Ein Ansatz ist 
es von der sogenannten kanonischen Reihenfolge oder Normal- 
Reihenfolge auszugehen* So konnte in der kanonischen Reihen- 
folge zunachst das Subjekt kommen, dem das Verb folgt, dem 
wiederum ein Adverb folgt, dem wiederum weitere eventuell 
noch vorhandene Satzbestandteile nachgeordnet sind. Ein 
Beispiel ist das Englische: Die hier geltende Satzstellungs- 
regel "Subjekt - Pradikat - Objekt" konnte eine der kanoni- 
sierenden Regeln fiir andere Sprachen wie das Deutsche sein. 
Jede andere Satzstellung konnte dann als x-te Permutation 
dieser kanonischen Reihenfolge kodiert werden. Dieses Kon- 
zept der kanonischen Reihenfolge laJ3t sich verallgemeinern : 
Es reicht, jeder Satzstellung immer wieder den gleichen Code 
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zuordnen zu konnen - egal in welcher Satzstellung sich der 
Eingabesatz befindet, Dazu muB die kanonische Reihenfolge 
nicht generiert werden. Vielmehr reicht es, wenn die Infor- 
mation benutzt wird, mit deren Hilfe grundsatzlich diese 
kanonische Reihenfolge erzeugt werden kann. In einer bei- 
spielhaften Realisierung konnte dies ein Regelsystem sein: 
In jeder Situation werden alle sich ergebenden Zustande nach 
Regelanwendung gleichartig durchnumeriert • Der Code fiir die 
gesamte Satzstellung konnte sich durch Konkatenation der so 
flir jeden Schritt der Regelanwendung ergebenden Codes ent- 
stehen* Diese Konkatenation kann wiederum nach alien aus der 
Datenkompression bekannten Varianten erstellt werden: Durch 
arithmetische , bitweise, byteweise, wortweise Verkettungen - 
moglicherweise mit Elimination von Redundanzen. 

An dieser Steile sei darauf hingewiesen/ daJ3 der Ausdruck 
"Satz" im Sinne der vorliegenden Erfindung dahingehend zu 
verstehen ist, daJ3 samtliche grammatikalischen Konstruktio- 
nen, welche genau ein Pradikat und zumindest einen weiteren 
Bestandteil aufweisen, als Satz zu verstehen sind. Damit 
sind sowohl Hauptsatze als auch Nebensatze im Sinne der vor- 
liegenden Erfindung jeweils fiir sich gesehen ein Satz^ da 
ein Hauptsatz, genauso wie ein Nebensatz, immer genau ein 
einziges Pradikat aufweist, und dariiberhinaus einen weiteren 
Bestandteil, der beispielsweise das Subjekt oder das Objekt 
sein konnte. 

Erf indungsgemaB werden daher im Gegensatz zum Stand der 
Technik nicht nur Satze, also grammatikalische Konstruktio- 
nen mit genau einem Pradikat und mindestens einem weiteren 
Bestandteil, untereinander umgestellt, sondern es konnen 
alle grammatikalisch akzeptablen Satzumstellungen innerhalb 
einer solchen grammatikalischen Konstruktion , wie z. B. 
eines Hauptsatzes oder eines Teilsatzes, auf der Ebene der 
kleinsten grammatikalisch korrekt umstellbaren Konstituenten 
durchgefiihrt werden. 



Solche kleinste grammatikalisch korrekt umstellbare Kon- 
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stituenten, also Bestandteile des Satzes konnen Artikel-No- 
men-Komplexe (2. B. das Haus), Artikel-Ad jektive/Adver- 
bien/Partizipien-Nomen-Komplexe (z, B. das schone, entlege- 
ne, braune Haus), ein Pradikat, ein direktes Objekt, 

ein indirektes Objekt, eine adverbiale Bestimmung (z. B. 
Zeit, Ort, Umstand, usw) , Prapositional-Phrasen (z. B. "vor 
dem Haus") sowie Pronomial-Phrasen (2, B. meines Freundes) 
umf assen. 

Die Aufteilung bzw. sprachliche Analyse eines Satzes in sei- 
ne Bestandteile, mittels deren Reihenfolge Inf ormationen in 
dem Text verborgen werden, kann rekursiv erfolgen, indem 
erst der gesamte Satz aufgeteilt wird, und indem dann fiir 
die einzelnen Haupt- und Gliedsatze einzelne Konstituenten 
bestimmt werden. 

Durch Nutzen einer gemeinsamen Baumstruktur fiir den vorzugs- 
weise verwendeten Parse-Baum der Konstituenten und eines 
Huf fman-Baumes mul3 keine weitere Datenstruktur dynamisch 
aufgebaut werden. Dies spart gleichzeitig Speicherplatz und 
Rechenzeit . 

Je nach Anwendungsf all ist die Tiefe der Aufteilung, d. h. 
wieviele Bestandteile eines Satzes ermittelt werden und in 
ihrer Reihenfolge verandert werden, von der Menge der in dem 
Text zu verbergenden Inf ormationen abhangig. Es muB also 
nicht bei jeder Anwendung des erf indungsgemaBen Konzepts der 
Satz in seine samtlichen kleinsten umstellbaren Bestandteile 
zerlegt werden. Vielfach dlirfte auch eine Umstellung der 
Reihenfolge von Gruppen von kleinsten Bestandteilen inner- 
halb eines Satzes geniigen. 

Falls die Einrichtung 18 zum Analysieren (Fig. 1) und die 
Einrichtung 2 0 zum Liefern von Formulierungsalternativen 
(Fig. 1) angeordnet sind, urn Paraphrasen zu verarbeiten, so 
konnen auch Mehrwortsynonyme verarbeitet werden. Eine Para- 
phrase ist z, B. die bekannte Redewendung "die Flinte ins 
Korn werfen". Ein Synonym dafur ist das Wort "auf geben" . In 
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dem Satz 

"Der Schliler warf wegen Latein die Flinte ins Korn." 

konnen somit bereits mindestens 2 Bits an inf ormationen 
mittels folgender Formulierungsalternative verborgen werden: 

"Wegen Latein gab der Schiiler auf." 

Ein erstes Bit steckt hierbei im Synonym "aufgeben" - "die 
Flinte ins Korn werf en" . Das zweite Bit steckt in der Stel- 
lung des Satzbestandteils "wegen Latein" vor oder nach dem 
Pradikat. Aus diesem Beispiel wird klar, daJ3 der Ausdruck 
"Synonym" im Hinblick auf die vorliegende Erfindung nicht 
nur "ein Wort fiir ein anderes Wort" bedeutet, sondern auch 
sog. Mehrwortsynonyme umfaJ3t, bei denen eine Wortgruppe 
durch ein einziges Wort oder umgekehrt ersetzt werden kann. 

Auch adjektivische, adverbiale, prapositionale Erganzungen 
und direkte/indirekte Objekte lassen sich jeweils unterein- 
ander umstellen. Es ist also nicht unbedingt erf orderlich, 
da/3 die Reihenfolge, beispielsweise des Subjekts zum Pradi- 
kat Oder des Objekts zum Pradikat, verandert wird, wenn In- 
formationen auch iiber direkte/indirekte Objekte oder adjek- 
tivische, adverbiale oder prapositionale Erganzungen verbor- 
gen werden konnen. 

Bei einem bevorzugten Ausf iihrungsbeispiel der vorliegenden 
Erfindung, das nicht nur auf ein Variieren der Reihenfolge 
der Textbestandteile aufbaut, sondern ebenfalls Synonyme 
verwendet, kann die Einrichtung zum Bestimmen einer Mehrzahl 
von Formulierungsalternativen auf die Lexikon/Grammatik- 
Stufe zugreifen, urn fiir ein Wort gleichbedeutende Synonyme 
zu ermitteln. Jedem dieser Synoyme sind ebenfalls eindeutige 
Teilinf ormationen zugeordnet, durch die das Synonym von ei- 
nem anderen Synonym eindeutig unterschieden werden kann. In 
einer bevorzugten Ausflihrung sind diese Teilinf ormationen 
Symbole im Sinne der Datenkompression, denen direkt im Lexi- 
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kon Bitcodes (Huffman Codierung) oder Wahrscheinlichkeits- 
intervalle ( Arithmetische Codierung) zugeordnet sind oder 
zugeordnet werden konnen. 

Vorzugsweise ist die Einrichtung 18 zum sprachlichen Ana- 
lysieren angeordnet, urn keine Textbestandteile zu liefern, 
fiir die die Korrektheit der Umf ormulierung nicht garantiert 
werden kann, Ferner ist die Einrichtung 2 0 zum Bestimmen von 
Formulierungsalternativen angeordnet, um nur solche Formu- 
lierungsalternativen anzubieten, fiir die sichergestellt ist, 
daJ3 bei deren Analyse wieder der gleiche Satz von Formulie- 
rungsalternativen erhalten werden kann. wird beispielsweise 
das Wort "Mutter" im zu modif izierenden Text betrachtet, so 
konnte es eine leibliche Mutter oder eine Schrauben-Mutter 
bezeichnen. Falls der Kontext nicht eindeutig z. B. der 
Maschinenbau ist, wiirde die Einrichtung zum sprachlichen 
Analysieren bei diesem Ausf iihrungsbeispiel den Textbestand- 
teil "Mutter" liberhaupt nicht liefern und darauf verzichten, 
in ein Synonym zu "Mutter" zu verbergende Inf ormationen zu 
verstecken. Analog dazu wiirde die Einrichtung 20 zum Be- 
stimmen der Mehrzahl von Formulierungsalternativen "Mutter" 
nicht als Synonym fiir einen Textbestandteil anbieten, falls 
der Kontext nicht eindeutig ist. 

Die Flexibilitat des Konzepts gemaB der vorliegenden Erfin- 
dung kann an die spezifischen Benutzeranf orderungen beliebig 
angepaJit werden, indem die Einrichtung 2 0 zum Bestimmen 
einer Mehrzahl von Formulierungsalternativen eine bestimmte 
Anzahl von Synonymgruppen umfaBt. Wird die Anzahl der Sy- 
nonymgruppen erhoht, so kann in einem gegebenen Text eine 
groJ3ere Menge von Geheiminf ormationen verborgen werden. Da 
im Gegensatz zum Stand der Technik das Konzept der vorlie- 
genden Erfindung auf beliebige Texte anwendbar ist, mliBte 
zum Erreichen einer maximalen Menge von zu verbergenden 
Inf ormationen in einer begrenzten Menge an Text die Ein- 
richtung 20 zum Erzeugen von Formulierungsalternativen fur 
jedes beliebige Wort eine entsprechende Anzahl von Synonymen 
bereitstellen konnen. Da jedoch die Anzahl der moglichen 
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Worter in einer Sprache sehr groi3 werden kann, ist es 
unwahrscheinlich, dai3 die Einrichtung 20 zum Bestimmen einer 
Mehrzahl von Formulierungsalternativen flir jedes beliebige 
Wort Synonyme erzeugen kann bzw* gespeichert hat, Trifft 
dieselbe auf ein Wort, fiir das es keine Synonyme hat, so 
wird sie dieses Wort einfach unverandert lassen. Die 
Einrichtung 2 0 kann dann selbstverstandlich auch keine 
Teilinformationen bestimmen, da keine Teilinf ormationen fiir 
dieses Wort vorhanden sind. Daher wird dieses Wort nicht 
dazu verwendet werden konnen, zu verbergende Inf ormationen 
"auf zunehmen" . Untersuchungen haben jedoch gezeigt, dafi die 
Anzahl der tatsachlich verwendeten Worter im groiien und 
ganzen relativ begrenzt ist, weshalb bei durchschnittlichen 
Texten, wie sie beispielsweise zum Ubermitteln von 
Geschaftsdaten eingesetzt werden, in begrenztem Auf wand 
Synonyme fiir nahezu alle dort auftretenden Worte lieferbar 
sind- Hier liegt gerade eine Starke der vorliegenden 
Erfindung, derart, daB durch weiteres Aufnehmen von 
Synonymgruppen in die Einrichtung zum Bestimmen von 
Formulierungsalternativen die erf indungsgemaBe Vorrichtung 
beliebig " auf geriistet " werden kann und somit je nach Anwen- 
dungsgebiet und Marktbedurf nissen maBgeschneidert werden 
kann. Weiterhin kann man komplette Synonymworterbiicher li- 
zenzieren und es sind auch eine Reihe von Verfahren bekannt, 
wie man Synonyme automatisch aus einer groBen Sammlung von 
Texten lernt. 



Die Einrichtung 22 zum Auswahlen einer Formulierungsalter- 
native aus der Mehrzahl von Formulierungsalternativen, 
derart, daB die Teilinformationen, die der ausgewahlten 
Formulierung zugeordnet sind, den zu verbergenden Inf orma- 
tionen entsprechen, arbeitet allgemein gesprochen wie ein 
Decodierer oder Dekomprimierer • 

Der "Wortschatz" fiir das Dekomprimieren der zu verbergenden 
Inf ormationen, d. h. die zu verbergenden Inf ormationen haben 
iiblicherweise eine hohere Inf ormationsdichte als der modifi- 
zierte Text. Hinzu kommt, daB Synonyme in Gruppen von mog- 



wo 00/54452 




PCT/EPOO/02144 



- 23 - 



lichst vielen Wortern mit untereinander gleicher oder ahnli- 
cher Bedeutung - Synonymmengen - angeordnet werden, so daJ3 
die Auswahl eines Synonyms einen moglichst hohen Informati- 
onsgehalt darstellt, 

Diese Auswahl der Alternativen wird durch die Einrichtung 22 
zum Auswahlen durchgefuhrt und wird durch die Einrichtung 2 0 
zum Bestimmen einer Mehrzahl von Formulierungsalternativen 
fiir den Text bereitgestellt ^ wobei der Wortschatz gemaiS der 
vorliegenden Erfindung grundsatzlich durch den Ausgangstext , 
d* h. den am Eingang 12 zugefuhrten Text, bestimmt wird, 
derart, dal3 im Gegensatz zum Stand der Technik, der ledig- 
lich einfache vordef inierte Grammatikstrukturen verwendet, 
beliebige Texte zum Verbergen von Inf ormationen genommen 
werden konnen. In einer bevorzugten Variante bestimmt sich 
der Wortschatz fur die Umf ormulierung exakt aus der Menge 
der Synonyme fiir die Worte im Ausgangstext , Eine wesentliche 
Eigenschaft ist die Reflexivitat der Synonym-Relation: 1st x 
synonym zu y, so ist auch umgekehrt y synonym zu x* 

Bei einem bevorzugten Ausf uhrungsbeispiel der vorliegenden 
Erfindung arbeitet die Einrichtung 22 als arithmetischer 
Decodierer oder Dekompressor , wahrend dieselbe bei einem 
anderen bevorzugten Ausf uhrungsbeispiel der vorliegenden 
Erfindung als bitbasierter Decodierer bzw. Dekompressor 
arbeitet. In diesem Fall werden zu verbergende Inf ormationen 
als Binardaten behandelt. Wenn die zu verbergenden Inf or- 
mationen Textdaten, d. h. Buchstaben oder Zahlen, sind, wer- 
den dieselben vorzugsweise mittels eines liblichen Kompri- 
mierungsprogrammes komprimiert, wobei solche in der Technik 
bekannten Komprimierer bereits Bitdaten ausgeben, 

Im Falle der arithmetischen Ausfiihrung werden die zur Ver- 
fligung stehenden Alternativen, die von der Einrichtung 2 0 
zur Verfligung gestellt werden, als "Kontext" bezeichnet, 
wahrend dieselben im Falle einer bitbasierten Ausfiihrung als 
"Worterbuch" behandelt werden. Diese Begriffe sind in der 
Literatur iiblich. Gemeinsam ist beiden, daB sie aus Paaren 
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bestehen, die auf Symbol-Wahrscheinlichkeitspaaren beruhen. 
Im Falle der bitbasierten Kodierung werden die Wahrschein- 
lichkeiten p durch Codes der Lange des negativen Zweierloga- 
rithmus von p "-ld(p)" - jeweils gerundet - dargestellt. 

Damit beliebige zu verbergende Inf ormationen verarbeitet 
werden konnen, derart, dafi sie eine giiltige Formulierungs- 
alternative ergeben, mussen die Teilinf ormationen , die den 
Wortstellungsreihenf olgen und/oder den Synonymen zugeordnet 
sind, eine bestimmte Bedingung erfiillen. Bei einer bitba- 
sierten Ausfiihrung lautet die Bedingung derart, dai3, falls 
fiir die Lange 1^ der i-ten Alternative als eine von n 
gleichzeitig moglichen Alternativen zu jedem Zeitpunkt fol- 
gende Bedingung erfiillt ist: 

n 

S 2-li = 1,0 
i=l 

Bei einer Ausfiihrung mittels arithmetischer Codierung/Deco- 
dierung rnuB die Gesamtsuitune der Gewichte aller Alternativen 
bekannt sein, damit die Gewichte zu Wahrscheinlichkeiten 
zurlickgerechnet werden konnen, die sich zu Eins aufsummie- 
ren. 

Bezuglich der arithmetischen Codierung/Decodierung und der 
bitbasierten Codierung, deren prominentester Vertreter das 
Huf fman-Codieren ist, existiert eine groBe Menge an Li- 
teratur. Beispielhaft sei hier "Managing Gigabytes" von 
Witten, Moffat und Bell, Van Nostrand Reinhold, New York, 
1994, genannt, Anschauliche Beispiele und Inf ormationen 
finden sich ebenfalls in "The Data Compression Book", von 
Nelson und Gailly, M & T Books. 

Zum Verstandnis der vorliegenden Erfindung sei jedoch auf 
den Grundgedanken der arithmetischen Codierung/Decodierung 
eingegangen. Im Gegensatz zur Huf f man-Codierung erlaubt die 
arithmetische Codierung eine beliebige Anpassung an die in 
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einem Text vorliegende Entropie, wahrend bei der Huffman- 
Codierung zumindest ein Bit pro Symbol vergeben warden muB. 

Die meisten Datenkompressionsverf ahren passen wahrend des 
Komprimierens laufend interne Statistiken an, um die zu 
erwartenden Daten moglichst exakt abschatzen zu konnen. 
Hierzu wird jedem Bestandteil ein Bereich oder eine Gewich- 
tung zugewiesen, dessen Breite der Wahrscheinlichkeit ent- 
spricht, Bei allgemeinen Codierverf ahren mui3 die Gesamtwahr- 
scheinlichkeit kleiner oder gleich 1,0 sein. Fiir die hier 
beschriebenen steganographischen Codierverf ahren mufl jedoch 
zwingend gelten, daB alle Wahrscheinlichkeiten/Gewichtungs- 
bereiche zusammen 1,0 ergeben. Dann wird mit der Codierung 
begonnen . Die Starke der arithmetischen Codierung besteht 
gerade darin, daJ3 ein zu codierendes Symbol auch Bruchteile 
einer Nachkommastelle - sprich eines Bits - belegen kann. 
Der aktuelle Codiererzustand wird durch die GroBe eines 
aktuellen Intervalls reprasentiert • Bei der Codierung wei- 
terer Zeichen wird dieses Intervall immer weiter eingeengt 
wie bei einer Intervallschachtelung • Allgemein gesprochen 
wird daher eine einzige Mantisse einer FlieBkommazahl er- 
zeugt, die eine codierte bzw. komprimierte Version der zu 
codierenden Eingangsdaten darstellt. 

Im Decodierer wird wiederum der umgekehrte Vorgang durchge- 
fiihrt* Die Einrichtung 22 zum Auswahlen einer Formulierungs- 
alternative aus der Mehrzahl von Formulierungsalternativen 
beginnt mit einem Intervall von 0 bis 1, d, h. dem groBt- 
moglichen Anf angsintervall . Die zu verbergenden Informa- 
tionen werden dabei, wie es bereits erwahnt wurde, als 
einzige Mantisse einer FlieBkommazahl betrachtet. Von den 
Bits dieser Mantisse werden vom Anfang her jeweils soviele 
Bits betrachtet, bis die Zahl, die diese Bits darstellen, 
eindeutig in einem der Wahrscheinlichkeitsintervalle liegt, 
die durch die Teilinf ormationen , die durch die Einrichtung 
20 zum Bestimmen einer Mehrzahl von Formulierungsalterna- 
tiven bestimmt werden, definiert sind. Die ausgewahlte Al- 
ternative hat somit ein zugeordnetes fest definiertes Inter- 
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vail- Dieses Intervall wird anschaulich gesprochen - aller- 
dings erst nach evtl. mehreren Schritten - wieder auf die 
Breite 1 skaliert. Damit konnen die weiteren Bits aus dem 
Datenstrom der zu verbergenden Inf ormationen wieder eine der 
Alternativen wahlen, deren Wahrscheinlichkeiten sich zu 1 
summieren. In der Praxis werden die Wahrscheinlichkeits- 
alternativen als ganzzahlige Werte, die Vielfache der 
eigentlichen Wahrscheinlichkeiten sind, verwaltet, wobei das 
Intervall nicht nach jedem Decodierungsschritt neu skaliert 
werden muB. Vielmehr werden die Intervallgrenzen so lange in 
einer Art Intervallschachtelung verkleinert, bis die Genau- 
igkeit nicht mehr gewahrleistet ist und neu skaliert werden 
inuJ3 • 

Zum Zwecke der Anschaulichkeit wird im Folgenden von Code- 
baumen im Zusammenhang mit der Huf f luan-Codierung gesprochen. 
Tatsachlich wiirde man dies nicht als Baum sondern als Tabel- 
le von praf ix-f reien Codes realisieren, wie dies aus der 
kanonischen Huf fman-Codierung bekannt ist. Dies ermoglicht 
eine hohere Geschwindigkeit bei weniger Speicherverbrauch. 
Ein solcher "Codebaum" ist als Teil eines Worterbuchs fiir 
die bitbasierte Codierung anzusehen. Ein Worterbuch enthalt 
darliber hinaus auch die Zuordnung der Symbole zu den Codes 
des "Kontextes" oder "Baumes". Praziser ist es , von Kontex- 
ten statt von Worterblichern und von tabellenf ormigen Kontex- 
ten statt von Baumen zu sprechen. 

Bei einem anderen Ausf lihrungsbeispiel der vorliegenden Er- 
findung wird statt der arithmetischen Codierung/Decodierung 
eine bitbasierte Codierung und insbesondere eine Huffman- 
Codierung verwendet. Wie es bekannt ist, kann ein einfacher 
Huffman-Code mittels einer Liste von Symbolen / Token und 
zugeordneten Haufigkeiten oder Wahrscheinlichkeiten erzeugt 
werden. Wenn jeder Zweig des Baums mit einem giiltigen Huff- 
man-Codewort abgeschlossen ist, konnen beliebige Inf orma- 
tionen codiert/decodiert werden, sofern sie sich mit den im 
Codebaum gespeicherten Symbolen darstellen lassen* Diese 
Bedingung wurde bereits weiter vorne allgemein ausgefuhrt. 
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Im Falle der Huf f inan-Codierung, die weiter hinten anhand 
eines Beispiels detaillierter erlautert ist, sind die 
Teilinf ormationen, die den einzelnen Formulierungsalterna- 
tiven, d. h, den Reihenfolgen der Textbestandteile und/oder 
den einzelnen Synonymen fur die Textbestandteile zugeordnet 
sind, Huf fman-Codeworter . Bei einem ublichen Huffman-Code 
wird zunachst der zu codierende Text statistisch analysiert, 
wobei das haufigste Zeichen in einem Text ublicherweise das 
Leerzeichen oder der Buchstabe "e" ist. Zeichen, die haufig 
vorkommen, werden moglichst kurze Codeworter zugeordnet, 
wahrend Zeichen, die sehr selten vorkommen, eher langere 
Codeworter zugeordnet werden, jedoch unter der Vorausset- 
zung, dai3 ein vollstandiger Codebaum entsteht. Damit wird, 
wie es fur Huffman-Codes bekannt ist, eine moglichst grofle 
Datenkompression erreicht. 

Allen verschiedenen grammatikalisch moglichen Reihenfolgen 
von Textbestandteilen wird somit ein Huf f man-Codewort zuge- 
ordnet, derart, dai3 die Huf fman-Codeworter fur die Reihen- 
folgen der Textbestandteile einen vollstandigen Codebaum 
ergeben* Dasselbe trifft flir die einzelnen Synonymsatze zu. 
So mlissen die Teilinf ormationen, d, h. die Huf fman-Code- 
worter, die einem Textbestandteil und den Synonymen zu 
diesem Textbestandteil zugeordnet sind, insgesamt einen 
giiltigen Codebaum ergeben. 

Wie es bereits ausgefiihrt worden ist, fuhrt die Einrichtung 
2 2 zum Auswahlen einer Formulierungsalternative aus der 
Mehrzahl von Formulierungsalternativen eine Huf f man-Decodie- 
rung durch. Sie erhalt als Eingangssignal die zu verbergen- 
den Inf ormationen und bewegt sich in einem Code-Kontext , der 
durch die Einrichtung 20 zum Bestimmen einer Mehrzahl von 
Formulierungsalternativen bereitgestellt wird, gemaB der 
Bitsequenz der zu verbergenden Inf ormationen soweit vor, bis 
ein giiltiges Codewort gefunden worden ist. Daraufhin wahlt 
die Einrichtung 22 diese Formulierungsalternative, wie bei- 
spielsweise eine bestimmte Wortstellungsreihenf olge . An- 
schlieJ3end kann dann der Synonym-Code-Kontext flir Kopf, 
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Subjekt, Komplemente, Adjunkte des Satzes verwendet werden. 
Allerdings ist zu beachten, da/3 die Ersetzung der Synonyme 
im Prinzip nur von der semantischen Kategorie und der 
Kontextinf ormation und nicht von der Wortfunktion (Subjekt, 
Kopf, Komplement, etc.) abhangt. Es kann deshalb mit der 
Ersetzung durch Synonyme in der Reihenfolge der Worter im 
umgestellten Satz ausgegangen werden* Allerdings lassen sich 
aus der Wortfunktion haufig morphologische KenngroBen naher 
eingrenzen , z • B . der Fall . Hierzu werden wieder die zu 
verbergenden Inf ormationen bitweise dazu dienen, nacheinan- 
der in den jeweiligen Code-Kontexten fiir die Synonyme soweit 
f ortzuschreiten, bis ein gultiges Codewort gefunden worden 
ist. Dieses Verfahren wird bei einem bevorzugten Ausfiih- 
rungsbeispiel der vorliegenden Erfindung fortgesetzt, bis 
ein Satz oder im groBeren Stil der gesamte Text vollendet 
ist. Die zu verbergenden Inf ormationen wurden dabei als eine 
Folge von Huf f man-Codeworten aufgefafit, die mittels ver- 
schiedener, durch die Einrichtung 20 und letztendlich durch 
den ursprlinglichen Text bestimmten Code-Kontexte in einen 
modif izierten Text umgewandelt, d. h. decodiert, worden 
sind, der dann ausgegeben wird. 

In einer bevorzugten Ausfiihrung wird zunachst die neue 
Worts tellung im Datenstrom codiert, worauf dann die Codes 
fiir die Ersetzung der Synonyme folgen. 

Die Einrichtung zum Bestimmen der Mehrzahl von Formulie- 
rungsalternativen kann angeordnet sein, um immer nur die 
eine Formulierungsalternative zu ermitteln, die durch die 
Einrichtung zum Auswahlen aufgrund der zu verbergenden 
Inf ormationen ausgewahlt wird. Beispielhaft anhand eines 
Codebaums ausgedrlickt ist es nicht notwendig, daB samtliche 
Zweige verfolgt werden, sondern an einem Knoten nur immer 
der Zweig, der schlieBlich zu dem Codewort flihrt. 

Bevor ein detailliertes Beispiel fiir die Funktionsweise der 
Vorrichtung 10 zum Verbergen von Inf ormationen gegeben wird, 
sei auf Fig. 2 eingegangen, die ein schematisches Block- 
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schaltbild einer Vorrichtung 50 zum Extrahieren von in einem 
modif izierten Text verborgenen Inf ormationen darstellt. Der 
modif izierte Text wird liber einen Eingang 52 in die Vorrich- 
tung 50 eingespeist. Die extrahierten Inf ormationen werden 
iiber einen Ausgang 54 ausgegeben. Die Vorrichtung 50 uinfaJ3t 
wiederum eine Einrichtung 56 zur sprachlichen Analyse des 
modif izierten Textes, urn die Textbestandteile des modif i- 
zierten Textes zu liefern. Aufgrund dieser Inf ormationen 
werden die Codes fiir die Wortstellung zugeordnet* Die 
Textbestandteile werden in eine Einrichtung 58 zum Liefern 
von Teilinf ormationen eingespeist, urn die Teilinf ormationen 
zu ermitteln, die den Textbestandteilen und/oder der Rei- 
henfolge der Textbestandteile zugeordnet sind. Dazu muJ3 die 
Einrichtung 58 zumindest fiir die durch die Analyse 56 
bestimmten Textbestandteile durch die Einrichtung 10 zum 
Verbergen (Fig. 1) festgelegten Teilinf ormationen ermitteln 
konnen. Vorzugsweise enthalt die Einrichtung 58 daher ebenso 
wie die Einrichtung 2 0 der Vorrichtung zum Verbergen die 
Lexikon/Grammatik-Stuf e , die Textbestandteilreihenf olge und 
zugeordnete Teilinf ormationen sowie Synonyme und zugeordnete 
Teilinf ormationen liefern kann. Die vorzugsweise bitformigen 
Teilinf ormationen, die auf Wahrscheinlichkeiten zuriickfiihr- 
bar sind und die dem modif izierten Text zugeordnet sind, 
werden einer Einrichtung 60 zum Kombinieren der Teilin- 
f ormationen, um die in dem modif izierten Text verborgenen 
Inf ormationen zu erhalten, zugefiihrt. Je nach Implementation 
der Vorrichtung zum Verbergen wird die Einrichtung 60 zum 
Kombinieren der Teilinf ormationen entweder als arithmeti- 
scher Codierer oder als Huf f man-Codierer oder als sonstiger 
Codierer abhangig von der Codiertechnik der Vorrichtung 10 
ausgefiihrt sein. Die kombinierten Teilinf ormationen werden 
schlieBlich einer Einrichtung 62 zum Ausgeben der verbor- 
genen Inf ormationen zugefiihrt, damit sie an dem Ausgang 54 
ausgegeben werden konnen. Die Ausgabevorrichtung enthalt 
vorzugsweise, wenn die zu verbergenden Inf ormationen kom- 
primierte Textdaten sind, eine Dekomprimiervorrichtung , 
derart, dai3 aus der Vorrichtung 50 zum Extrahieren keine 
Bitdaten sondern beispielsweise Textdaten ausgegeben werden. 
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Im nachf olgenden wird die Funktionsweise der Vorrichtung 10 
zum Verbergen von Inf ormationen bei einer Implementation 
mittels Huf fman-Codierung/Decodierung in der Auswahlein- 
richtung 22 bzw, der Kombinationseinrichtung 60 in der 
Vorrichtung 50 zum Extrahieren dargestellt, Der Beispielsatz 
lautet : 

"Das Auto fahrt schnell bei glatter StraBe iiber den Hligel." 

Die Einrichtung zum sprachlichen Analysieren 18 wird diesen 
Satz in f olgende Teilphrasen zerlegen: 

1: Das Auto, 
2: fahrt, 

3 : schnell , - - . . 

4: bei glatter StraBe, 
5: uber den Hiigel. 

Es sei darauf hingewiesen, daB der Beispielsatz bereits in 
der sogenannten kanonischen Reihenfolge (d. h, Subjekt, 
Verb, Adverb, Prapositionalad junkte , •..) vorliegt. Die 
Ziffern vor den Satzbestandteilen konnen nun zur Kurz- 
darstellung der Wortstellungsalternativen verwendet werden. 
So steht beispielsweise "42135" fiir den Satz: 

"Bei glatter StraBe fahrt das Auto schnell iiber den Hiigel." 

Diese alternative Wortstellung ist eine von der Einrichtung 
20 zum Bestimmen von Formulierungsalternativen erzeugte 
Wortstellung, die sich von der urspriinglichen Wortstellung 
unterscheidet , die jedoch grammatikalisch richtig ist und 
den im wesentlichen gleichen Sinn wie der urspriingliche Text 
ergibt. Allgemein gesagt ist das Grundprinzip bei der Ge- 
nerierung der Wortstellungsalternativen, daB in jeder 
Wortklasse, insbesondere auch in jeder Verbklasse, die zur 
Generierung der korrekten Wortstellungsalternativen not- 
wendigen Inf ormationen gespeichert sind. So kann bei- 
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spielsweise die Reihenfolge der Konstituenten in den 
Subjekt-, den Komplement- und den Ad junkt-Attributen der 
jeweiligen lexikalischen Eintrage in einer Lexikon/Gram- 
matik-Stufe zu den jeweiligen Klassen definiert warden. Die 
Einrichtung zum Bestimmen einer Mehrzahl von Formulierungs- 
alternativen, die vorzugsweise ebenfalls als HPSG-System 
ausgefiihrt ist, ist dann in der Lage, die folgenden Wort- 
stellungsalternativen regelbasiert zu erzeugen (in Klammern 
dahinter stehen kanonische Huf f man-Codeworter fiir die ein- 
zelnen Textbestandteile ) : 

12345 (111), 12435 (110), 32145 (1001), 32154 (1000), 34215 
(0111), 35214 (0110), 42135 (0101), 45213 (0100), 45231 
(0011), 52134 (0010), 54213 (0001), 54231 (0000) (13 Wort- 
stellungsalternativen) . 

Die Binarfolgen hinter den einzelnen Wortstellungsalterna- 
tiven stellen die Teilinf ormationen dar, die der jeweiligen 
Wortstellungsalternative zugeordnet sind. Es zeigt sich, daB 
hier ein Code-Kontext mit 13 Codewortern verwendet wird, 
wobei drei Wortstellungsalternativen ein Codewort mit einer 
Lange von 3 Bit haben, wahrend die restlichen 10 Wortstel- 
lungsalternativen ein Codewort mit einer Lange von 4 Bit 
haben. 

Analog dazu wird die Lieferung einer Mehrzahl von Formulie- 
rungsalternativen fiir den Text durch Verwenden von Synonymen 
fiir die Textbestandteile durchgef iihrt . Nachfolgend sind 
Synonyme und in Klammern dahinter stehende kanonische Huff- 
man-Codeworter fiir die einzelnen Textbestandteile darge- 
stellt. 

- Auto (111), Kraftwagen (110), Kraf tf ahrzeug (101), Wagen 
(100), Limousine (Oil), Personenkraf twagen (010), Pkw 
(0011), Automobil (0010), Fahrzeug (00011), Schese 
(00010), Vehikel (00001), Gefahrt (00000) (12 Synonyme) 



- fahrt (11), rollt (10), bewegt sich fort (01), rast 
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(001), gondelt (0001), braust (0000) (6 Synonyme) 

- schnell ( 111 ) , . blitzartig (110), hurtig (101), rapide 
(1001), pfeilschnell (1000), kometenhaft (0111), blitz- 
schnell (0110), flott (0101), pf eilgeschwind (0100), 
rasch (0011), rasant (0010), geschwind (00011), fix 
(00010), eilig (00001), flugs (00000) (15 Synonyme) 

bei (1), auf (0) (2 Worter mit ahnlichem Sinn nur in die- 
sem Kontext) 

- glatter (11), schlittriger (10), vereister (Oil), spie- 
gelglatter (010), eisglatter (0011), rutschiger (0010), 
schlickriger (0001), glitschiger (00001), schlupfriger 
(00000) (9 Synonyme) 

- StraBe (11), Fahrbahn (10), HauptstraBe (Oil), Lands traBe 
(010), FernverkehrsstraBe (0011), FahrstraBe (0010), 
Fahrweg (0001), Fahrspur (0000) (8 Synonyme) 

- Hiigel (11), Berg (10), Erhebung (Oil), Anhohe (0101), Ho- 
henzug (0100), Bodenerhebung (0011), Hohenrlicken (0010), 
Steigung (00011), Hohe (00010), Buckel (00001), Hooker 
(00000) (11 Synonyme) 

Wieder ist zu sehen, daB jede Synonymklasse einen eigenen 
Code-Kontext bildet, derart, daB sich fur den Beispielsatz 7 
Synonym-Code-Kontexte ergeben, wobei fiir beliebige andere 
Textbestandteile fur beliebige andere Beispielsatze eben- 
falls entsprechende Code-Kontexte durch die Einrichtung zum 
Bestimmen einer Mehrzahl von Formulierungsalternativen dyna- 
misch erzeugt bzw. von einem Speicher abgerufen werden kon- 
nen. In einer vorzugsweisen Realisierung ist ein solcher 
Speicher mit einem Lexikon oder Thesaurus gekoppelt. 

Aus diesem Beispiel ist zu sehen, daB haufig erwarteten oder 
verwendeten Synonymen vorzugsweise kurzere Codes gegeben 
werden als weniger haufig erwarteten Synonymen. AuBerdem ist 
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zu sehen, daJ3 beim Auftauchen eines der Worter dieser Syno- 
nymliste genau alle Worter der Liste als Synonyme generiert 
werden miissen, damit ein vollstandiger Codebaum vorhanden 
ist. Im vorliegenden Beispiel miiBten also auch beim Auftre- 
ten von "Fahrzeug" nur genau die Auto-Synonyme generiert 
werden, nicht aber Worter wie beispielsweise "Lastwagen, 
Motorrad, usw.". Fur solche Effekte kann ein Ahnlich- 
keitsschwellwert vorgesehen werden, der dazu dient, eine 
Sinnveranderung zu eliminieren , die entstehen wiirde, wenn 
der Begriff "Auto" durch "Lastwagen" ersetzt werden wlirde. 

Die folgende Bitseguenz, die die zu verbergenden Informa- 
tionen darstellt: 

0010/0011/0 01/0101/0/10/0101 
wlirde den Satz 

"Uber die Anhohe rast der PKW blitzschnell auf eisglatter 
Fahrbahn. " 

codieren. 

Die Originalreihenf olge ohne eine Vertauschung der Stellung 
der Textbestandteile wlirde f olgendermafien lauten: "Der PKW 
rast blitzschnell auf eisglatter Fahrbahn liber die Anhohe" . 
Dies wlirde dem binaren Teil ohne das Prafix flir die Wort- 
stellung entsprechen, der in Bitdarstellung lautet: 

0011/001/0101/0/10/0101 

Es sei darauf hingewiesen, daJi die Schragstriche in der 
Bitdarstellung flir die zu verbergenden Inf ormationen nur aus 
optischen Grlinden vorhanden sind. In der Praxis wird nichts 
derartiges codiert, Artikel und Gro/5/Kleinschreibung werden 
nach den jeweiligen Erf ordernissen durch die Einrichtung 20 
zum Bestimmen einer Mehrzahl von Formulierungsalternativen 
gesetzt. Zur Praposition "liber" gibt es hier kein Synonym- 
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Deshalb bleibt sie unverandert • 

Es sei darauf hingewiesen, daB wirklich jede Bitsequenz, 
wenn sie nicht zu lang ist, einen gliltigen Sat 2 mit 
ahnlicher Bedeutung erzeugt. Wird beispielsweise das 10, 
Bit, d, h, die zweite "0" im Symbol 001 fiir "rasen" 
eliminiert, so erhalt man stattdessen "bewegt sich fort", 
also: "liber die Anhohe bewegt sich der PKW blitzschnell auf 
eisglatter Fahrbahn fort." 

Wlirde nun das 15. Bit, d. h. die letzte "1" im Symbol 0101 
fiir "blitzschnell" eliminiert, so verbleibt bei der 
Selektierung des Adjektivs noch die Bitfolge 0100100101 im 
Datenstrom, Da ein Symbol 010 nicht in diesem Kontext 
existiert, da die Codes prafix-frei sind, muJ3 ein Bit zur 
Selektion des Adjektivs hinzugenommen werden* Es wird dann 
das Symbol 0100 selektiert, was fiir "pf eilgeschwind" steht. 
Es verbleibt dann 100101 im Datenstrom. Die erste 1 wahlt 
"bei" statt "iiber" wie im Beispiel mit einer 1 mehr, Im 
Datenstrom verbleibt dann noch 00101, wobei zunachst das 
Symbol 0010 selektiert wird, das fiir "rutschiger" steht- 
SchlieBlich bleibt eine einzige 1 im zu verbergenden 
Datenstrom iibrig. Damit konnte nun entweder "StraBe" (11) 
Oder "Fahrbahn" (10) selektiert werden. Diese Wahl ist 
vollig frei. Es wird somit durch die Bitsequenz 

00 10/0011/00 1/0 100/1/0010/ Ix 

der Satz "Uber die Anhohe rast der PKW pf eilgeschwind bei 
rutschiger StraBe" erzeugt, wobei x willkiirlich zu 1 gesetzt 
wurde, Diese Bitsequenz unterscheidet sich nur von der 
Ausgangssequenz dadurch, daB hier das urspriingliche 15. Bit 
fehlt. 

In Abweichung vom beschriebenen Ausf iihrungsbeispiel konnte 
statt einer kanonischen Huf f man-Codierung auch eine einfache 
Huf f man-Codierung mit Baumen verwendet werden. Die kano- 
nische Codierung ermoglicht jedoch eine wesentlich effi- 
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zientere Decodierung durch das Nachsehen in Tabellen anhand 
der ersten Codewortbits und durch die Beschrankung auf nur 
wenige effiziente additive/subtraktive Operationen, Auch die 
kanonische Huf f man-Codierung ist der Technik bekannt. 

Im Vorangegangenen wurde darauf hingewiesen, dai3 kiirzeren 
Codewortern eine gebrauchlichere Satzstellung bzw. eine 
gebrauchlichere Synonymalternative zugeordnet warden kann. 
Dabei wird davon ausgegangen, dai3 kiirzere Codeworter hier 
haufiger in einem Datenstrom von zu verbergenden Informa- 
tionen auftreten, weshalb die gebrauchlicheren Alternativen 
bzw. Synonyme haufiger gewahlt werden . 

Im Nachf olgenden wird auf Fig. 3 eingegangen, in der das 
Verfahren, das zum Bestimmen einer Mehrzahl von Formulie- 
rungsalternativen fiir den Text ausgefiihrt wird, schematisch 
dargestellt ist. Beispielhaft ist hier die Erzeugung von 
Alternativen fiir eine Phrase nach dem HPSG-Gedanken darge- 
stellt. Zunachst wird in einem Schritt 300 der Kopf eines 
Satzes gesucht. Dies ist in der Kegel ein finites Verb, das 
Pradikat. In einem Lexikoneintrag in der Lexikon/Grammatik- 
Stufe zu diesem Verb steht dann, welche Art von Komplementen 
und was fiir ein Subjekt das Verb zulaBt. Teilweise konnen 
auch Adjunkte oder idiomatische Wendungen im Lexikoneintrag 
ausgewiesen sein. Sowohl syntaktische wie auch semantische 
Inf ormationen konnen im Lexikon verzeichnet sein oder 
mittels ( lexikalischer ) Regeln hergeleitet werden. So kann 
z. B. fiir ein Wort (Subjekt, Komplement oder Adjunkt) 
verzeichnet sein, ob es sich um ein lebendiges Wesen, einen 
Menschen, ein Tier, ein Objekt, einen abstrakten Begriff, 
usw. handelt, Auch konnen hier schon Inf ormationen liber 
mogliche Wortstellungsalternativen abrufbar sein. Im 
Idealfall sind aus den lexikalischen Inf ormationen die 
Wahrscheinlichkeiten fiir alle denkbaren Alternativen 
ableitbar, wie es in einem Schritt 302 angedeutet ist. Aus 
diesen Wahrscheinlichkeiten werden die Teilinf ormationen 
erzeugt, die jeder Formulierungsalternative , d. h. jedem 
Synonym und jeder Wortstellungsalternative zugeordnet sind. 
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Es konnen also Synonyme zum Kopf der Phrase, d- h. des 
Textes gesucht warden, Wendungen mit gleicher Bedeutung 
gesucht werden oder Wortstellungsalternativen aufgestellt 
werden. Fig, 4, auf die spater eingegangen wird, zeigt eine 
detailliertere Erlauterung des Schritts 302. 

Die lexikalischen Inf ormationen des Kopfes engen die Mog- 
lichkeit fiir die restlichen Glieder des Satzes ein. In- 
nerhalb dieser Teilphrasen oder Textbestandteile wird 
wiederum nach einem Kopf gesucht, wie es in einem Schritt 
303 angedeutet ist. Dies kann beispielsweise eine Proposi- 
tion innerhalb einer Prapositionalphrase sein oder aber ein 
Verb in einem Nebensatz. Der ProzeB setzt sich rekursiv 
fort. Somit konnen Wortstellungsalternativen generiert 
werden, sobald die Analyse des Satzes weit genug fortge- 
schritten ist. Wurde im Schritt - 30 0 kein Kopf gefunden, 
entweder weil keiner vorhanden ist, oder weil sich 
Schwierigkeiten beim sprachlichen Analysieren oder Parsen 
ergeben, konnen iminerhin noch Synonyme generiert werden und 
feststehende Wendungen durch ahnlich-bedeutende ersetzt 
werden (Schritt 304). 

Grundsatzlich mui3 beim Erzeugen einer Mehrzahl von Formu- 
lierungsalternativen beriicksichtigt werden, daJ3 alle For- 
mulierungsalternativen flir den Text grammatikalisch richtig 
sind und den im wesentlichen gleichen Sinn im gleichen 
Kontext unter Beriicksichtigung einer Ahnlichkeitsschwelle 
haben, derart, daB der modifizierte Text nicht derart 
auffallig ist, dai3 in ihm geheime Inf ormationen vermutet 
werden. 

Fig. 4 zeigt die Behandlung einer einzelnen Alternative i. 
Jede Alternative wird zunachst auf ihre Alternativenklasse 
zuriickgef lihrt (Schritt 400). Dies kann beispielsweise die 
Klasse der korrekten Wortstellung fiir diesen Satz sein oder 
die semantische Klasse, der ein Wort angehort. In einem 
Schritt 4 02 wird entweder auf eine existierende Wahrschein- 
lichkeitsverteilung , d. h. auf bereits existierende Teilin- 
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f ormationen, zurlickgegrif f en, oder es kann nach bestiininten 
Regain, die auch der Vorrichtung zum Extrahieren von Infor- 
mationen (Fig. 2) bekannt sind, eine Wahrscheinlichkeits- 
verteilung, d. Teilinf ormationen , erzeugt werden. Keine 

Neugenerierung ist erf order lich , wenn der vom Benutzer an- 
gegebene Ahnlichkeitsschwellwert so klein ist, daB er nicht 
groBer ist als die minimale Distanz zwischen der jeweils 
aktuellen und der benachbarten semantischen Konzeptgruppe . 
Ist der Ahnlichkeitsschwellwert hoher, so sollten alle 
semantischen Konzeptgruppen, deren Abstand zur Kernsemantik 
geringer als dieser Schwellwert ist, zu einer semantischen 
Gruppe zusammengef aBt werden • Ein bevorzugtes Verf ahren zum 
Berechnen der semantischen Ahnlichkeit in Taxonomien wurde 
vorgestellt in Jay J. Jiang and David M. Conrath (1997), 
"Semantic similarity based on corpus statistics and lexical 
taxonomy", in Prodeedings of International Conference 
Research on Computational Linguistics (ROCLING X), Taiwan. 

Grundsatzlich werden einf ach die Gewichte aller beteiligten 
Elemente zu einem Gesamtgewicht aufsummiert, um daraus dann 
auf die Wahrscheinlichkeiten und somit auf die Teilinforma- 
tionen der einzelnen Alternativen zu schliei3en. Dabei soil- 
ten die Gewichte, die einer entfernten semantischen Gruppe 
angehoren, entsprechend herunterskaliert werden, Eine 
schnelle aber ungenaue Variante besteht darin, nach grober 
Abschatzung Wahrscheinlichkeits- oder Codebereiche fur die 
Alternativen zu reservieren, die in einer semantischen Grup- 
pe liegen. 

Falls die Einrichtung 22 zum Auswahlen (Fig. 1) eine arith- 
metische Codierung/Decodierung verwendet, kann ganz ohne Ge- 
nauigkeitsverlust ein Intervall fur jede semantische Gruppe 
reserviert werden, was sich aus der Gesamtsumme der dort 
vorhandenen Gewichte herabskaliert entsprechend der Ent- 
ferntheit der Konzepte ergibt. Im Falle einer bitbasierten 
Auswahleinrichtung 22 konnte einf ach ein Codebereich, z. B. 
alle Codes, die mit J' 110*' anfangen, fiir die entfernte se- 
mantische Gruppe reserviert werden. Ein Schritt 4 04 zeigt 
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die Funktion der Auswahleinrichtung 22, d. h. die Codierung 
der geheimen Nachricht durch Wahl der den Nachrichtenbits 
entsprechenden Alternative. AnschlieBend wird zur nachsten 
Alternative i+1 ubergegangen . 

Sollen mehrere geheime Nachrichten, d, h. inehrere zu ver- 
bergende Inf ormationen , in den Text eingebracht werden, so 
wird typischerweise vor Beginn der ersten geheimen Infor- 
mationen eine Praambel in den Strom eingefiigt, die die 
Anzahl der vorhandenen geheimen Datenquellen und auch die 
Bitpositionen ihres Anfangs im Datenstrom codiert* Typi- 
scherweise wird jede geheime Datenquelle mit einem anderen 
Schllissel verschliisselt und mit Kontrollinf ormationen 
versehen, Bei der Decodierung wird dann der Benutzer nach 
dem Schliissel/den Schliisseln gefragt und es wird nur der. 
geheime Teil decodiert, zu- dem der Schllissel pafit. Ob der 
Schllissel paJ3t kann wiederum aus den Kontrollinf ormationen 
Oder aus den decodierten Daten selbst geschlossen werden. 
Soli es sich bei dem decodierten Text, d. h. dem Text am 
Ausgang des Extrahierers 50, urn einen sinnvollen Text 
handeln und ist dies nicht der Fall, so war der Schllissel 
f alsch. 

Bei einer aufwendigeren Implementation der vorliegenden 
Erfindung kann der Benutzer die Generierung und die Auswahl 
der Alternativen spezifischer beeinf lussen, indem er 
beispielsweise angibt, welche Worter vermieden werden sol- 
len, beispielsweise um besonders altertiimliche Synonyme 
auszuschlieiJen , ob der modifizierte Text eine minimale, eine 
mittlere oder eine maximale Satzlange haben soil, ob der 
neue Text eine bestimmte Sprachkomplexitat oder ein bestimm- 
tes Sprachniveau, wie z. B. gehoben, einfach, umgangssprach- 
lich, historisch usw. haben soil, welche Satzbaumodelle und 
Wortstellungsmodelle bevorzugt werden, ob der Text moglichst 
stark verandert werden soil, ob versucht werden soil, die 
Lesbarkeit des Textes zu erhohen, welche Liste von Wortern 
durch andere grundsatzlich ersetzt werden sollen, und wie 
mit vermuteten Fehlern umgegangen werden soil, beispiels- 
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weise mittels einer automatischen Korrektur^ einer in- 
teraktiven Korrektur, oder ob die Fehler grundsatzlich 
ignoriert werden sollen. Voraussetzung dafiir ist jedoch 
immer, wie bereits oft erwahnt wurde, dai3 die Granunatik 
korrekt wiedergegeben werden kann, d. h. dai3 insbesondere 
flektierte Verbformen angepaJit werden. Solche Optionen 
werden typischerweise am Beginn des Datenstroms oder in 
einer auBeren Codierungsebene in die zu verbergenden 
Inf ormationen eincodiert. Vorteilhaft ist es, jeweils kurze 
komprimierte Symbole fiir die Codierung eines typischen 
Satzes von Konf igurationsdaten einzusetzen. 

Das Ende des geheimen Datenstroms kann im allgemeinen Fall 
der Datenkompression auf mehrere Arten und Weisen codiert 
werden, und zwar einerseits durch eine explizite Speicherung 
der Bitlange in der Praambel der zu komprimierenden Daten, 
Oder durch Codierung einer Variante mit der Bedeutung "Ende 
des geheimen Datenstroms". Damit die letztere Variante 
moglich ist, mlifite jedoch in jedem Kontext ein solches 
Symbol explizit codiert werden. Dies erhoht jedoch die 
Entropie und damit die Lange der komprimierten Daten. Im 
Falle des Codiergangs zum Verbergen geheimer Daten ist diese 
zweite Variante ohnehin nicht moglich: Eine Bitsequenz im 
geheimen Datenstrom konnte vorzeitig das Ende-Symbol 
selektieren und damit eine Fehlinf ormation codieren. 

Bei einem bevorzugten Ausf iihrungsbeispiel der vorliegenden 
Erfindung benutzt die Einrichtung 20 zum Bestimmen einer 
Formulierungsalternative (Fig. 1) bzw, die Einrichtung 58 
zum Liefern von Teilinf ormationen (Fig. 2) einen Wort- 
speicher in Form eines Baumes, z. B. eines Tries (eine 
Baumdatenstruktur flir Buchstaben, abgeleitet von "infor- 
mation retrieval"), oder vorzugsweise eines Graphen, be- 
stehend aus (a) Wort-Vollf ormen , also flektierten Wortern, 
die dann zu anderen flektierten Wortern in Beziehung gesetzt 
werden oder (b) morphologisch-syntaktische Zerlegungen der 
Worter, etwa nach Flektionsklassen und insbesondere eine 
Aufspaltung in Wortprafixe, Wortstamme und Wortsuffixe, 
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wobei lediglich die Wortstamme oder Wortpraf ix-Wortstamin- 
Kombinationen explizit als Synonyme in Beziehung gesetzt 
werden mlissen und die jeweiligen flektierten Formen ent- 
sprechend dem aktuellen Bedarf beim jeweils vorgef undenen 
Wort anhand von Flektionsdaten analysiert und fiir ein 
gewahltes Synonym entsprechend generiert werden* 

Synonymverweise sind dabei organisiert sind als (a) Kette 
von synonymen Bedeutungen eines Wortes , die erstens ring- 
formig aufeinander verweisen und zweitens implizit durch 
eine Ordnungsvorschrif t wie die lexikalische Reihenfolge 
Oder Anordnung nach Vorkoininenswahrscheinlichkeit oder ex- 
plizit durch eine Kennzeichnung des Ranges eines oder meh- 
rerer Elemente geordnet sind oder als (b) Gruppe von als 
synonym betrachteten Wortern oder als Verweise auf die Sy- 
nonyme mit der Eigenschaft, daB umgekehrt auch von den 
betroffenen Synonymen auf diese Gruppe verwiesen wird oder 
diese Gruppe als Wert eines Synonyms gespeichert wird. 

Es sei darauf hingewiesen^ daB sich ein HPSG-Parser zum Ein- 
satz beim erf indungsgemaBen Konzept besonders gut eignet, da 
mit ihm auch das Problem von Mehrdeutigkeiten bei Umstellung 
von Bestandteilen des Satzes angegangen werden kann. Dies 
wird anhand des folgenden Beispielsatzes dargestellt, Der 
Beispielsatz lautet: 

"Er sieht den Mann auf dem Berg mit dem Fernglas." 

Dieser Satz hat prinzipiell vier korrekte Bedeutungen, die 
darin bestehen, daB "er" oder "der Mann" jeweils "auf dem 
Berg stehen" oder "ein Fernglas haben" . Dagegen hat der ahn- 
liche Satz 

"Er sieht den Stern auf dem Berg mit dem Fernglas." 



nur eine korrekte Bedeutung. Aufgrund der semantischen Ei- 
genschaften von "Stern", und insbesondere aufgrund der Gro- 
Benverhaltnisse zu den anderen Gegenstanden , kann der HPSG- 
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Parser aufgrund seiner inneren hierarchisch organisierten 
Baumstruktur ermitteln, daJ3 ein Stern nicht auf einem Berg 
stehen kann und auch kein Fernglas haben kann. 

Andere Verfahren zur Reduktion der Mehrdeutigkeiten , welche 
auch als Disambiguisierung bezeichnet werden^ sind stati- 
stisch und/oder regelbasiert . Solche Verfahren konnen ent- 
weder statt eines HPSG-Parsers oder erganzend zu einem 
HPSG-Parser eingesetzt werden. Diese Verfahren basieren auf 
Worterbiichern mit Kontexten, durch die eine groBe Menge von 
potentiellen Mehrdeutigkeiten korrekt aufgelost sind. Solche 
Worterblicher werden oftmals per Hand oder aber semi-automa- 
tisch erstellt. Die Vorrichtungen und Verfahren der vorlie- 
genden Erfindung konnen ohne weiteres auf solche bereits be- 
stehenden Worterblicher zuriickgreif en • Aufgrund der vorkom- 
menden Worter oder aufgrund der vorkommenden graminatikali- 
schen Strukturen werden dann vorzugsweise unter Verwendung 
solcher Worterblicher statistische oder regelbasierte Gesetz- 
maBigkeiten automatisch ermittelt. 

So ist zwar eine Sinnverf alschung durch Variieren lediglich 
der Reihenfolge der Textbestandteile nicht so wahrscheinlich 
wie bei der Verwendung von Synonymen. Erf indungsgemaB wird 
jedoch auch hier im Sinne des Grundgedankens der Steganogra- 
phie darauf geachtet, daB neben der grammatikalischen Rich- 
tigkeit keine bzw. keine allzugroBen Sinnveranderungen durch 
das Verbergen der Inf oritiationen auftritt. Daher wird grund- 
satzlich auf Formulierungsalternativen abgestellt, die einen 
identischen Sinn haben. Falls dies im konkreten Fall nicht 
moglich ist oder falls die Anzahl der dann moglichen Formu- 
lierungsalternativen zu gering ist, wird immer versucht^ 
eine in einem gewissen Rahmen bef indliche kleine Abweichung 
in den Bedeutungsgehalten der Formulierungsalternativen si- 
cherzustellen • Ist auch dies flir einen bestimmten Satz nicht 
moglich, so werden in diesem Satz keine Inf ormationen ver- 
borgen, sondern er wird libergangen. 
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Patien-banspruche 

Vorrichtung (10) zum Verbergen von Inf ormationen in 
einem Text, der zumindest einen Satz aufweist, mit fol- 
genden Merkmalen : 

einer Einrichtung (12) zum Liefern des Textes; 

einer Einrichtung (18) zum sprachlichen Analysieren des 
Textes, urn Textbestandteile zu liefern, wobei die Text- 
bestandteile Bestandteile des Satzes sind, und wobei 
der Satz neben zumindest einem weiteren Bestandteil als 
Bestandteil genau ein Pradikat aufweist; 

einer Einrichtung (20) zum Bestimmen einer Mehrzahl von 
Formulierungsalternativen fur den Text 

- durch Variieren der Reihenfolge der Textbestandteile 
selbst , 

- durch Ermitteln von Synonymen fiir die Textbestandtei- 
le und Variieren der Reihenfolge der Synonyme fiir die 
Textbestandteile , oder 

- durch Ermitteln von Synonymen fiir zumindest einen 
Textbestandteil und Variieren der Reihenfolge eines 
Synonyms fiir den zumindest einen Textbestandteil und 
eines anderen Textbestandteils des Satzes, 

wobei jede Formulierungsalternative fiir den Text gram- 
matikalisch richtig ist und den im wesentlichen glei- 
chen Sinn wie der Text hat, wobei jeder Reihenfolge und 
jedem ermittelten Synonym bestimmte Teilinf ormationen 
zugeordnet sind; 

einer Einrichtung (22) zum Auswahlen einer Formulie- 
rungsalternative aus der Mehrzahl von Formulierungs- 
alternativen, derart, daB die Teilinf ormationen , die 
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der ausgewahlten Formulierungsalternative zugeordnet 
sind, zumindest einem Teil der zu verbergenden Infor- 
mationen entsprechen; und 

einer Einrichtung (24) zum Ausgeben der Formulierungs- 
alternative, die einen modif izierten Text bildet, wobei 
in dem modif izierten Text die zu verbergenden Informa- 
tionen verborgen sind. 

2. Vorrichtung (10) nach Anspruch 1, bei der die Einrich- 
tung (18) zum sprachlichen Analysieren ein Parser, ins- 
besondere ein hochlexikalisierter unif ikationsbasierter 
Parser und speziell ein HPSG-Parser ist. 

3. Vorrichtung (10) nach Anspruch 1 oder 2, bei der die 
Einrichtung (20) zum Bestimmen einer Mehrzahl von For- 
mulierungsalternativen eine Lexikon/Grammatik-Stuf e 
aufweist, derart, daJ3 grammatikalisch richtige Formu- 
lierungsalternativen geliefert werden^ 

4. Vorrichtung nach Anspruch 3, bei der in der Lexi- 
kon/Grammatik-Stuf e Synonyme fiir Textbestandteile sowie 
fur jedes Synonym eindeutige Teilinf ormationen gespei- 
chert sind wie syntaktische , semantische, kontextuelle 
und statistische Inf ormationen . 

5. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, 

bei der jeder Reihenfolge der Textbestandteile und 
jedem ermittelten Synonym als Teilinf ormationen eine 
Gewichtung zugeordnet ist, wobei die Gewichtung derart 
bestimmt ist, daJ3 alle Gewichtungen fiir die Reihenfolge 
bzw. die Synonyme zusammen eine Wahrscheinlichkeit von 
1 ergeben, und 

bei der die Einrichtung (22) zum Auswahlen angeordnet 
ist, um gemaiJ den Regeln der arithmetischen Decodierung 
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jeweils eine Formulierungsalternative zu wahlen, ge- 
steuert durch die als codierte Daten aufgefaBten gehei- 
men Daten. 

Vorrichtung (10) nach einem der Anspriiche 1 bis 4, bei 
der die Teilinf ormationen Huf f man-Codeworter sind, wo- 
bei folgende Gleichung gilt: 

n 

i = 1 

wobei li die Lange in Bit des i-ten Huf f man-Codeworts 
ist, und wobei n die Anzahl von Huf f man-Codewortern 
eines Kontextes ist, wobei alle Synonyme fur einen 
Textbestandteil einschlieBlich des Textbestandteils 
zusammen einen eigenen Kontext bilden, wobei alle ver- 
schiedenen Reihenfolgen von Textbestandteilen ein- 
schlieBlich der Reihenfolge der Textbestandteile im 
Text einen eigenen Kontext bilden, derart, dai3 alle 
beliebigen zu verbergenden Inf ormationen einen Strom 
von gliltigen Huf f man-Codewortern darstellen, 

Vorrichtung (10) nach Anspruch 5, bei der die zu ver- 
bergenden Inf ormationen eine Bitsequenz aufweisen, wo- 
bei die Einrichtung (22) zum Auswahlen angeordnet ist, 
urn von dem Anfang der Bitsequenz so viele Bits zu neh- 
men, bis die Zahl, die diese Bits darstellen, eindeutig 
in einem speziellen der Wahrscheinlichkeitsintervalle 
liegt^ die durch die Gewichtungen bestimmt sind, wo- 
raufhin die Einrichtung (22) zum Auswahlen die Formu- 
lierungsalternative auswahlt, die der dem speziellen 
Wahrscheinlichkeits interval 1 zugeordneten Gewichtung 
entspricht, woraufhin die Einrichtung (22) zum Auswah- 
len eine weitere Intervallschachtelung vornimmt, um die 
nachste Formulierungsalternative zu wahlen. 



Vorrichtung (10) nach Anspruch 6^ bei der die Einrich- 
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tung zum Auswahlen (22) angeordnet ist, um eine Huff- 
man-Decodierung durchzuf iihren , wobei dieselbe nach- 
einander auf verschiedene Huf f man-Code-Kontexte zu- 
greift, die durch die Textbestandteile aus einer Anzahl 
von durch die Einrichtung (20) zum Bestimmen einer 
Mehrzahl von Formulierungsalternativen bereitgestellten 
Formulierungsalternativen selektiert werden, wobei die 
Eingabe in die Huf f man-Decodierung die zu verbergenden 
Inf ormationen sind, und wobei die Ausgabe aus der Huff- 
man-Decodierung der modif izierte Text ist. 

9. Vorrichtung nach einem der Anspriiche 3 bis 8, bei der 
jeder Textbestandteil zumindest ein Wort aufweist, und 
wobei die Synonyme fiir jedes Wort in der Lexikon/Gram- 
matik-Stufe zusammen mit den entsprechenden Teilinfor- 
mationen gespeichert sind, wahrend die Teilinf ormatio- 
nen flir jede unterschiedliche Reihenfolge der Textbe- 
standteile nach einer Modellierung realer linguisti- 
scher Gesetze durch deklarative Regeln, Constraints 
Oder feste Implementationen in Software vorgegeben 
sind. 

10. Vorrichtung (10) nach Anspruch 9, bei der die Einrich- 
tung (22) zum Auswahlen angeordnet ist, um einen ersten 
Abschnitt der zu verbergenden Inf ormationen flir die 
Auswahl der Reihenfolge der Textbestandteile zu verwen- 
den und die nachf olgenden Abschnitte fiir die Auswahl 
der Synonyme zu verwenden und wobei die Reihenfolge der 
ausgewahlten Synonyme eine unter einer oder mehreren 
linguistisch moglichen Reihenfolgen selektierte ist und 
von der Reihenfolge der Textbestandteile im Text unab- 
hangig ist* 

11. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, die ferner folgendes Merkmal aufweist: 

eine Einrichtung zum Verschliisseln und/oder Komprimie- 
ren der zu verbergenden Inf ormationen , wodurch ver- 
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schliisselte und/oder komprimierte zu verbergende Infor- 
mationen erzeugt werden, die in die Einrichtung (22) 
zum Auswahlen einspeisbar sind^ 

12. Vorrichtung nach einem der vorhergehenden Anspriiche, 
bei der die Einrichtung (18) zum sprachlichen Analysie- 
ren angeordnet ist, keine Textbestandteile zu liefern, 
fiir die die Korrektheit der Umf ormulierung nicht garan- 
tiert werden kann, und/oder bei der die Einrichtung 
(20) zum Bestimmen von Formulierungsalternativen ange- 
ordnet ist, urn nur solche Formulierungsalternativen 
anzubieten, fiir die sichergestellt ist/ dai3 bei deren 
Analyse wieder der gleiche Satz von Formulierungsalter- 
nativen erhalten werden kann. 

13. "Vorrichtung nach einem der vorhergehenden Anspruche^ 

bei der es einen offentlichen Text und geheime Daten 
gibt, wobei die Vorrichtung (10) eine Steuereinrichtung 
aufweist, die derart angeordnet ist, um die Informatio- 
nen der geheimen Daten der Einrichtung (22) zum Auswah- 
len zuzuflihren^ derart, dai3 dieselben durch Modifizie- 
ren des offentlichen Textes in demselben verborgen wer- 
den. 

14. Vorrichtung nach Anspruch 13, bei der die zu einer Kom- 
pression und/oder Verschllisselung verwendeten Statisti- 
ken vom offentlichen Text abhangig sind, so dai3 Uber- 
einstimmungen von Datenf ragmenten im offentlichen Text 
und den geheimen Daten zur effizienten Kompression ge- 
nutzt werden. 

15. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, bei der die Einrichtung (20) zum Bestimmen der 
Formulierungsalternativen iiber die Teilinf ormationen 
steuerbar ist, um einen bestimmten Stil einzuhalten, 
insbesondere um bestimmte Formulierungsalternativen zu 
bevorzugen bzw. auszuschlieBen , wie z. B. bestimmte 
Worter, bestimmte Satzlangen, welche Sprachkomplexitat , 
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welches Sprachniveau , welche Satzbau- und Wortstel- 
lungsmodelle, welche Erzahlperspektive , welchen ethni- 
schen Schwerpunkt bzgl. der Herkunft der Worter der 
modif izierte Text haben soil, welche Liste von zu ver- 
meidenden Wortern verwendet werden soil, wie mit ver- 
muteten Fehlern im Text: umzugehen ist und ob neue Feh- 
ler eingebaut werden diirfen. 

16. Vorrichtung nach einem der vorhergehenden Anspriiche, 
bei der eine Ahnlichkeitsschwelle vorgebbar ist, der- 
art, daJ3 die Einrichtung (20) zum Bestimmen von Formu- 
lierungsalternativen ahnliche Formulierungsvarianten 
fiir den Text bestinunt, deren semantische Unterschiede 
zur Ausgangsalternative unter der Ahnlichkeitsschwelle 
liegen, wahrend Formulierungsalternativen , deren se- 
mantische Unterschiede zur Ausgangsalternative iiber der 
Ahnlichkeitsschwelle liegen, verworfen werden, 

17. Vorrichtung nach Anspruch 15, bei der die Textmenge 
begrenzt ist, wobei die Ahnlichkeitsschwelle derart 
bemessen ist, dafi gerade alle zu verbergenden Infor- 
mationen in der begrenzten Textmenge untergebracht 
werden konnen • 

18. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, bei der die Einrichtung (20) zum Bestimmen einer 
Mehrzahl von Formulierungsalternativen angeordnet ist, 
um dynamisch die Formulierungsalternativen zu bestim- 
men, und um dynamisch die Teilinf ormationen zu erzeu- 
gen, die jeder Formulierungsalternative zugeordnet 
sind. 

19. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, bei der die Einrichtung (20) zum Bestimmen einer 
Mehrzahl von Formulierungsalternativen angeordnet ist, 
um nur die Formulierungsalternative aus der Mehrzahl 
von Formulierungsalternativen auszugeben, die durch die 
Einrichtung (22) zum Auswahlen aufgrund der zu verber- 
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genden Inf ormationen ausgewahlt wird. 

0. Vorrichtung (50) zum Extrahieren von in einem modifi- 
zierten Text verborgenen Inf ormationen, wobei der modi- 
fizierte Text zumindest einen Satz aufweist, mit fol- 
genden Merkmalen: 

einer Einrichtung (52) zum Liefern des modif izierten 
Textes ; 

einer Einrichtung (56) zum sprachlichen Analysieren des 
modif izierten Textes, um Textbestandteile des modif i- 
zierten Textes zu liefern, wobei die Textbestandteile 
Bestandteile des Satzes sind, und wobei der Satz neben 
zumindest einem weiteren Bestandteil als Bestandteil 
genau ein Pradikat aufweist; 

einer Einrichtung (58) zum Liefern von Teilinf ormatio- 
nen, die der Reihenfolge der Textbestandteile und, 
falls der modifizierte Text in sprachlichen Bedeutungen 
der Textbestandteile verborgene Inf ormationen hat, den 
sprachlichen Bedeutungen der Textbestandteile zugeord- 
net sind, wobei die Einrichtung zum Liefern von Teilin- 
f ormationen die gleichen Teilinf ormationen liefert, die 
bei dem Verbergen der Inf ormationen , um den modif izier- 
ten Text zu erzeugen, der Reihenfolge der Textbestand- 
teile und gegebenenf alls den sprachlichen Bedeutungen 
der Textbestandteile zugeordnet waren; 

einer Einrichtung (60) zum Kombinieren der Teilinf orma- 
tionen, die flir den modif izierten Text durch die Ein- 
richtung zum Liefern (58) von Teilinf ormationen gelie- 
fert wurden, um die in dem modif izierten Text verbor- 
genen Inf ormationen zu erhalten; und 



einer Einrichtung (62) zum Ausgeben der verborgenen 
Inf ormationen . 
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21, Vorrichtung (50) nach Anspruch 20, bei der die Teilin- 
formationen Gewichtungen sind, wobei die Einrichtung 
(60) zum Kombinieren der Teilinf ormationen eine arith- 
metische Codierung ausfuhrt, um die verborgenen Inf or- 
mationen zu extrahieren, 

22* Vorrichtung (50) nach Anspruch 20, bei der die Teil- 
inf ormationen einfache oder kanonische und insbesondere 
prafix-freie Huf f man-Codeworter sind, wobei die Ein- 
richtung (60) zum Kombinieren der Teilinf ormationen 
eine Huf f man-Codierung ausfuhrt, wobei die Code-Kon- 
texte, die zur Huf f man-Codierung verwendet werden, 
durch die Einrichtung (58) zum Liefern selektiert wer- 
den und den Code-Kontexten entsprechen, die wahrend des 
Verbergens von Inf ormationen eingesetzt wurden, 

23* Vorrichtung (50) nach einem der Anspriiche 20 bis 22, 
bei der die Teilinf ormationen , die beim Verbergen ver- 
wendet wurden, zunachst die Reihenf olge der Textbe- 
standteile und daran anschliei3end die Synonyme der 
Textbestandteile in einer vorbestimmten Reihenfolge 
betreffen, wobei die Einrichtung (60) zum Kombinieren 
der Teilinf ormationen angeordnet ist, um aus der Rei- 
henfolge der Textbestandteile des modif izierten Textes 
zunachst die Teilinf ormationen, die sich auf die Rei- 
henfolge beziehen, abzuleiten und dann ausgehend von 
einer vorgegebenen Reihenfolge der Textbestandteile 
nacheinander die Teilinf ormationen , die den einzelnen 
Textbestandteilen zugeordnet sind, abzuleiten. 

24. Vorrichtung (50) nach einem der Anspriiche 20 bis 23, 
bei der die Einrichtung (58) zum Liefern von Teilinf or- 
mationen ferner folgendes Merkmal aufweist: 

eine Einrichtung zum Bestimmen einer Mehrzahl von For- 
mulierungsalternativen fiir den modif izierten Text durch 
Variieren der Reihenfolge der Textbestandteile und/oder 
durch Verwenden von Synonymen oder Paraphrasen fiir die 
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Textbestandteile , wobei j ede Formulierungsal ternative 
fiir den Text grammatikalisch richtig ist und den im 
wesentlichen gleichen Sinn wie der Text hat^ wobei je- 
der Reihenfolge und/oder jedem Synonym oder jeder Para- 
phrase bestimmte Teilinf ormationen zugeordnet sind, 

wobei die Einrichtung (58) zum Liefern von Teilinf orma- 
tionen angeordnet ist, um auf die Einrichtung zum Be- 
stimmen einer Mehrzahl von Formulierungsalternativen 
zuzugreifen, um die Teilinf ormationen , die sich auf die 
Reihenfolge und/oder die sprachliche Bedeutung der 
Textbestandteile des modif izierten Textes beziehen, 
wieder zugewinnen . 

5* Verfahren zum Verbergen von Inf ormationen in einem 
Text, der- zumindest einen Satz aufweist, mit ' f olgenden 
Schritten: 

Liefern des Textes; 

sprachliches Analysieren des Textes, um Textbestandtei- 
le zu liefern, wobei die Textbestandteile Bestandteile 
des Satzes sind, und wobei der Satz neben zumindest 
einem weiteren Bestandteil als Bestandteil genau ein 
Pradikat auf weist ; 

Bestimmen einer Mehrzahl von Formulierungsalternativen 
fur den Text 

- durch Variieren der Reihenfolge der Textbestandteile 



- durch Ermitteln von Synonymen fiir die Textbestandtei- 
le und Variieren der Reihenfolge der Synonyme fiir die 
Textbestandteile , oder 



selbst , 



- durch Ermitteln von Synonymen fiir zumindest einen 
Textbestandteil und Variieren der Reihenfolge eines 
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Synonyms fvir den zumindest einen Textbestandteil und 
eines anderen Textbestandteils des Satzes, 

wobei jede Formulierungsalternative flir den Text gram- 
matikalisch richtig ist und den im wesentlichen glei- 
Chen Sinn wie der Text hat, wobei jeder Reihenfolge und 
jedem ermittelten Synonym bestimmte Teilinf ormationen 
zugeordnet sind; 

Auswahlen einer Formulierungsalternative aus der Mehr- 
zahl von Formulierungsalternativen, derart, daB die 
Teilinf ormationen, die der ausgewahlten Formulierungs- 
alternative zugeordnet sind, den zu verbergenden Inf or- 
mationen entsprechen; und 

Ausgeben der Formulierungsalternativen, die einen mo- 
difizierten Text bilden, wobei in dem modif izierten 
Text die zu verbergenden inf ormationen enthalten sind. 

26. Verfahren zum Extrahieren von in einem modif izierten 
Text verborgenen Inf ormationen , wobei der modif izierte 
Text zumindest einen Satz aufweist, mit folgenden 
Schritten: 

Liefern des modif izierten Textes; 

sprachliches Analysieren des modif izierten Textes, um 
Textbestandteile des modif izierten Textes zu liefern, 
wobei die Textbestandteile Bestandteile des Satzes 
sind, und wobei der Satz neben zumindest einem weiteren 
Bestandteil als Bestandteil genau ein Pradikat auf- 
weist; 

Liefern von Teilinf ormationen , die der Reihenfolge der 
Textbestandteile und den sprachlichen Bedeutungen der 
Textbestandteile zugeordnet sind, wobei die gleichen 
Teilinf ormationen geliefert werden, die bei dem Verber- 
gen der Inf ormationen , um den modif izierten Text zu er- 
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zeugen, der Reihenfolge der Textbestandteile und, falls 
der inodif izierte Text in sprachlichen Bedeutungen der 
Textbestandteile verborgene Inf ormationen hat, den 
sprachlichen Bedeutungen der Textbestandteile zugeord- 
net waren; 

Kombinieren der Teilinf ormationen, die fiir den modifi- 
zierten Text durch den Schritt des Lieferns von Teil- 
inf ormationen geliefert wurden, um die in dem modifi- 
zierten Text verborgenen Inf ormationen zu erhalten; und 

Ausgeben der verborgenen Inf ormationen • 

21. Vorrichtung nach Anspruch 1 Oder 20, bei der die Ein- 
richtung (20) zum Bestimmen von Formulierungsalternati- 
ven bzw. die Einrichtung (58 ) zum Lief ern -von Teilin- 
f ormationen angeordnet ist , um einen Wortspeicher in 
Form eines Baumes oder eines Graphen zu benutzen, der 
besteht aus (a) Wort-Vollf ormen, also flektierten Wor- 
tern, die dann zu anderen flektierten Wortern in Bezie- 
hung gesetzt sind oder (b) morphologisch-syntaktische 
Zerlegungen der Worter nach Flektionsklassen und insbe- 
sondere eine Aufspaltung in Wortprafixe, Wortstamme und 
Wortsuffixe, wobei lediglich die Wortstamme oder Wort- 
praf ix-VJortstamm-Kombinationen explizit als Synonyme in 
Beziehung gesetzt sind und die jeweiligen flektierten 
Formen entsprechend dem aktuellen Bedarf beim jeweils 
vorgef undenen Wort anhand von Flektionsdaten analysiert 
und fiir ein gewahltes Synonym entsprechend generiert 
werden . 

28. Vorrichtung nach Anspruch 27, dadurch gekennzeichnet , 
daii Synonymverweise entweder organisiert sind als (a) 
Kette von synonymen Bedeutungen eines Wortes, die er- 
stens ringformig aufeinander verweisen und zweitens 
implizit durch eine Ordnungsvorschrif t wie die lexi- 
kalische Reihenfolge oder Anordnung nach Vorkommens- 
wahrscheinlichkeit oder explizit durch eine Kennzeich- 
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nung des Ranges eines oder mehrerer Elemente geordnet 
sind, Oder als (b) Gruppe von als synonym betrachteten 
Wortern oder als Verweise auf die Synonyme mit der 
Eigenschaft, daB umgekehrt auch von den betroffenen 
Synonymen auf diese Gruppe verwiesen wird oder diese 
Gruppe als Wert eines Synonyms gespeichert wird. 
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